谷歌回归搜索领域,在AI能力拓展上迈出了关键一步——其最新推出的URL Context功能(已于5月28日在Google AI Studio上线)让Gemini系列模型具备了深度解析网页内容的能力。
这项集成于Gemini API的功能不仅支持网页文本解析,更能处理PDF文档与图像内容。
Google产品负责人Logan Kilpatrick对此表现出极大热情,在公开场合多次推荐开发者将其设为默认启用的核心配置选项。
面对”这与我之前直接发送链接给AI有何不同”的疑问:传统方式中用户提供的链接通常会被AI通过通用浏览器或插件简单抓取摘要信息;
而URL Context作为专为开发者设计的API接口,在调用时会明确指示Gemini将指定URL中的完整内容(最大支持34MB)作为唯一权威依据进行深度解析。
这种差异体现在对文档结构、数据关联性和完整性的全面理解层面——就像人类阅读时既关注文字也留意图表排版那样系统化处理信息。
该功能的具体技术优势包括: – 精准提取PDF表格数据(如特斯拉季度财报第4页资产/负债表) – 自动识别并标注文档中的隐私遮蔽标记(***符号) – 通过两级检索机制平衡效率与实时性:优先调用内部缓存加速常见页面解析,在遇到新发布页面时启动实时抓取 成本方面采用按Token计费模式——处理内容量越大生成Token数越多费用相应增加。
这种设计既鼓励开发者优化信息源选择效率,也凸显了该服务在精准场景应用中的价值定位。
值得注意的是URL Context并未取代传统RAG架构(基于外部知识库增强回答准确性的方法),而是针对公开网络内容场景提供了更简洁高效的解决方案。
对于需要处理企业私有文档或要求高度安全性的场景而言,自主搭建RAG系统仍是必要选择。
这一创新揭示了当前AI基础模型的发展趋势:越来越多原本由应用层承担的数据预处理工作正在被整合到模型服务底层——这既是技术进步带来的便利性提升,也是云计算服务模式演进的重要标志。
评论列表 (0条):
加载更多评论 Loading...