在多家开发AI的企业之中,马斯克(Elon Musk)的xAI算得上是比较特别的一个,主力产品Grok具有交际渠道X上的内容作为辅佐数据,也参加罕有的“风趣形式”能够恶作剧。最近他们更在开发者文件中表明,行将晋级模型到多模态版别,支撑图画输入。
xAI在上个月现已预告将会推出Grok-1.5V模型,为现在的Grok谈天机器人参加多媒体处理才能,据称新版别将会能处理多种形象资讯,包含文件、图表、屏幕截屏和相片等等。他们更宣称新版别在多个基准测验中都适当挨近乃至逾越现在其他竞争对手,例如GPT-4、Claude 3和Gemini Pro 1.5。
而在最新揭露的开发者文件中,xAI更供给了Python脚本典范,展现了开发者怎么样去运用xAI的软件开发工具包(SDK)库来生成根据文本和图画的回应。该脚本能够读取图画,设置文本提示,并使用xAI SDK发生回应。Grok-1.5V到底在实践运用上能否业界尖端规范依然有待调查,不过信任不必等好久就不可贵知了。