王小川旗下百川智能今日发布 Baichuan-13B 大模型,号称“130 亿参数开源可商用”。
▲ 图源 Baichuang-13B GitHub 页面
据官方介绍,Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在中英文 Benchmark 上均取得同尺寸模型中最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。
▲ 图源 Baichuang-13B GitHub 页面
官方宣称,Baichuan-13B 有如下几个特点:
更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿,并且在高质量的语料上训练了 1.4 万亿 tokens,超过 LLaMA-13B40%,是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为 4096。
同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此项目中同时具有对齐模型(Baichuan-13B-Chat),具有很强的对话能力,开箱即用,几行代码即可简单地部署。
更高效的推理:为了支持更广大用户的使用,项目中同时开源了 int8 和 int4 的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达 RTX3090 这样的消费级显卡上。
开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。
目前该模型已经在 HuggingFace、GitHub、Model Scope 公布,感兴趣的 小伙伴们可以前往了解。
关键词:
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com为了帮助视障人士,瑞士联邦理工学院(ETH Zürich)D-ITET 项目学习中心的学生开发出一种机器人导盲犬,其能够利用...
WooHoo 是一家总部位于硅谷的解决方案提供商,也是 WooHoo X 系列的开发商,WooHoo® X 系列是一款屡获殊荣的豪华酒店业企业
针对今年在Google I O 2024宣布推出,并且先在美国市场以测试性质推出的AI Overviews搜索结果总结功能,目前进一步开放印度、日本、
日前宣布将自动生成式人工智能带到Jetson机器人平台后,英伟达研究团队更公布名为Eureka的解决方案,将通过OpenAI的GPT-4...
YouTube 正在测试一项名为 Aloud 的人工智能配音功能,可将影片内容口述翻译为其他语言。 图源 Pixabay 从官方获取到,
Poe 是由知名问答网站 Quora 创立的一个 AI 聊天机器人平台,近日 Poe 发布了一系列的更新,包括 Mac 应用、与同一个 AI 机
针对此次在re:Invent 2024更新的Amazon Q自动生成式人工智能助理平台,AWS人工智能市场营销负责人David Pessis进一步说明此平台是
科大讯飞星火认知大模型V2 0正式发布,重点发布代码能力和多模态能力,并推出面向老师、学校、企业、开发者等更多元的应...
NVIDIA今日宣布公司创办人暨首席执行官黄仁勋将在GTC 2023发表主题演讲,内容将涵盖在人工智能、元宇宙、大型语言模型、...
京东方面宣布,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版 ChatGPT:ChatJD,并公布 Ch...
亚马逊针对其串流影音服务Prime Video提供名为X-Ray Recaps的工具,可利用人工智能针对个人视频观看进度自动生成前情回...
原本以Project Tailwind为称、能以人工智能汇整不同来源资料的谷歌笔记服务NotebookLM,目前已经将其背后的人工智能模型换成Gemini 1
阿里巴巴智能计算研究院的研究人员推出了一款名为EMO的人工智能系统——Emote Portrait Alive的缩写。顾名思义,人工智能工...
CASIO曾在CES 2021期间展示搭载情感能力、名为Moflin的人工智能机器人,并且标榜各自拥有不同个性,或是依照时间相处产...
OpenAI在今3月中旬推出可混合输入、增加图像识别能力的全新GPT-4大型语言模型之后,稍早于其第一届开发者大会上公布名为G...
Stability AI 日前发布新闻稿,宣布推出 SDXL 0 9 版本更新,升级了 Stable Diffusion 文本生成图片模型。 Stability AI
▲2023世界人工智能大会 2024世界人工智能大会暨人工智能全球治理高级别会议将于7月4日于上海举行,本届大会将展出AI机器...
Yelp产品负责人Craig Saldanha在接受TechCrunch网站访谈时表示,人工智能已经改变Yelp的用户体验,目前Yelp诸多公告内容都是以人工智
爆火的 AI 文本转语音公司 ElevenLabs 近日宣布扩展其平台,推出支持 28 种语言的新的文本转语音模型Eleven Multilingual v2,
金山办公 WPS AI 于 4 月 18 日正式发布,最先应用于在线内容协作编辑工具轻文档,并将陆续嵌入金山办公全线产品。 金山办公
Menteebot 是 Mentee Robotics 的新产品,它是一款专为家庭或商业用途设计的人类大小的机器人,将人工智能技术提升到了一个全新的水平
美国航空航天局(NASA)工程师表示,他们正在研发一种类似于《2001 太空漫游》中的超级电脑 HAL 9000 的人工智能(AI)界面,未来可能
Mistral AI 是一家巴黎初创公司,七个月前由 Meta 和谷歌的研究人员创立,目前已筹集 3 85 亿欧元(约合 4 15 亿美元),这再
百川智能发布Baichuan2-53B 闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B不仅数学和逻辑推理能力提升显著,还通过
在今日举行的 2023 年华为云数字文娱 AI 创新峰会上,华为云全球 Marketing 与销售服务总裁石冀琳表示,华为云将在后续推出盘古
Infinix推出了 Infinix AI,这是一种开创性的 AI 解决方案,旨在增强用户与技术的交互。随着 Infinix AI 的加入,即将推出的 I
Meta 于今天宣布推出 Segment Anything 工具,可准确识别图像中的对象。该项目包括模型、数据集,并以较为宽松的 Apache 2 0 许
Aptos Labs 是一家领先的区块链平台,专注于 Web3 开发。近日,该公司宣布与微软达成战略合作,将微软的 Azure OpenAI 服务集成
宇树 Unitree Go2 四足机器人现已发布,共有三个版本:AIR、PRO、EDU,售价 9997 元起。 Go2 搭载 Unitree 自研 4D
继一款由文字生成影片的AI模型Sora面世后,AI领域又掀起了Kimi概念,并刺激多只上市股份急升,而且Kimi助手的App和小程序亦曾...
早在 2022 年,当 ChatGPT 刚刚向公众推出时,人们就对其类人反应和清晰记住指令的能力感到惊叹。然而,如果对话持续很长...
近日,微软正式公布,将推出整合了ChatGPT的新版Bing搜索引擎。 根据微软企业副总裁兼消费领域首席营销官Yusuf Mehdi...
据路透社报道,日本一家名为 Tsubame Industries 的新创公司日前开发出一款高 4 5 米的机器人,其拥有酷似高达的外形,配备 4
Meta 公司宣布开发出一款名为 CM3Leon 的人工智能模型,该模型可以根据文本生成高质量的图像,也可以为图像生成文本描...
NEC在CEATEC 2023期间展示其内部使用的大型自然语言模型NEC Generative AI Framework,主要通过928组GPU、580 PFLOPS算力表现的超