微软Bing搜索团队正式开源Harrier多语言嵌入模型,该模型支持超过100种语言的文本向量化,在多项国际评测中达到业界领先水平。这是微软在AI开源领域的又一重要举措,有望推动多语言NLP应用的普及。
Harrier模型采用了创新的对比学习架构,在保持高维语义表达能力的同时大幅降低了推理成本。模型在MTEB多语言基准测试中排名前三,特别是在低资源语言上的表现优于Google的Universal Sentence Encoder。
嵌入模型是RAG、语义搜索、文本聚类等应用的核心组件。Harrier的开源为开发者提供了除OpenAI、Google之外的又一高质量选择。微软表示,该模型已在内应用于Bing搜索的多语言理解和广告匹配系统,经过了大规模生产环境的验证。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...