对标亚马逊、OpenAI，谷歌(GOOGL)连发AI利器：多模态模型Gemini-Embedding-2正式上线

2026-03-11

美股投资网获悉，谷歌(GOOGL)周二发布其首个多模态人工智能(AI)模型Gemini Embedding 2，这是这家科技巨头推出的最新模型，可将文本、图像、视频、音频和文档映射到一个统一的嵌入空间中。

谷歌在一篇博客文章中表示“Gemini Embedding 2将文本、图像、视频、音频和文档映射到一个统一的嵌入空间，并能在100多种语言中捕捉语义意图。” “这简化了复杂的处理流程，并增强了多种多模态下游任务——从检索增强生成(RAG)和语义搜索，到情感分析和数据聚类。”

作为Gemini系列AI模型的最新成员，该模型支持最多8192个文本输入token;每次请求可处理最多6张图像，支持PNG和JPEG格式;可处理最长120秒的视频，支持MP4和MOV格式;能够直接摄取并嵌入音频数据而无需转录;并且可以直接嵌入最长6页的PDF文档。

谷歌补充称“Gemini Embedding 2不仅仅是对传统模型的改进。”在将其与亚马逊(AMZN)、Voyage模型以及谷歌其他模型进行比较时，谷歌表示“它为多模态深度树立了新的性能标准，引入了强大的语音能力，并在文本、图像和视频任务中超越领先模型。这种可衡量的性能提升以及独特的多模态覆盖能力，使开发者能够获得满足其多样化嵌入需求的一切工具。”

最专业的美股资讯推荐美股大数据 https://Stockwe.com/

如何识别美股市场异常波动？美国机构主力资金买卖情况，出货和吸筹，使用美股投资网VIP会员，2008年成立于美国硅谷，由前纽约证券交易所分析师Ken创立，联合多位摩根斯坦利分析师，谷歌 Meta工程师利用AI和大数据，配合十多年美股实战经验和业内量化模型，建立了一个股市数据库 https://StockWe.com/ 每天处理千万级股票数据：捕捉期权大单，实时主力资金流向、机构持仓变化、川普突发新闻，精准交易信号第一时间发到您手机APP！

« OpenClaw龙虾全球爆火，背后最受益的公司 NET #Cloudflare 抢占先机！Meta(META)拿下“龙虾”们的社交圈…… »

返回顶部

欢迎交流美股分析师微信号

MaxStockWe