老男人
首页 时尚 玩车 保健 情感
更多
腕表 饮食 视频 美女 百科
0
老男人 > 科技 > 正文

王小川又双叒叕发布大模型了 号称领先LLaMA 2

2023-09-07 17:36:50 发布人:hao333 阅读( 6364)

作者|蒋浇百川智能又发布大模型了。9月6日,王小川旗下百川智能正式发布开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2...

王小川又双叒叕发布大模型了 号称领先LLaMA 2

作者|蒋浇

百川智能又发布大模型了。

9月6日,王小川旗下百川智能正式发布开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本,均为免费可商用,这是继6月15日发布首款开源大模型Baichuan7B后的又一次重大技术迭代。

据了解,Baichuan 2-7B-Base 和 Baichuan 2-13B-Base,均基于 2.6万亿高质量多语言数据进行训练。其中Baichuan 2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

王小川称,70亿参数的Baichuan2-7B开源大模型中文水平超越了LLaMA2 130亿参数模;在英文的评测上,Baichuan2-7B开水平与LLaMA2 130亿参数模型持平。

王小川又双叒叕发布大模型了 号称领先LLaMA 2

王小川又双叒叕发布大模型了 号称领先LLaMA 2

他表示,“随着国内Baichuan2开源大模型的发布,用LLaMA2作为大家一个开源模型的时代已经过去了。”

国内“百模大战”中,各家都在卷参数规模,卷响应速度,卷行业落地。而在国外,AI模型竞争主要聚焦在“生态封闭”和“生态开源”。其中,闭源模型的代表当属目前最强的GPT-4模型,开源最具代表意义的则是Meta的LLaMA2模型。

业内普遍认为,开源大模型对于大量开发者是一个福音,能够降低做大模型应用的门槛。美国斯坦福大学基金会模型研究中心主任Percy Liang 曾指出,像LLaMA2这样强大的开源模型会对OpenAI 构成相当大的威胁。

今年6月,王小川飞往美国硅谷与同行交流大模型技术思路。他认为,美国闭源大模型的头部格局已定,OpenAI、Anthropic、Google已经拿到门票,LLaMA2则统一了美国开源模型市场,而国内大模型格局还未定型,创业公司还有较大的机会。

在8月举办的一次媒体交流会上,王小川谈及大模型技术路线之争时表示,开源与闭源并不矛盾,未来会像苹果和安卓系统一样并行发展。未来可能80%的企业会用到开源模型,因为开源模型小巧,最后靠闭源提供剩下20%的增值服务。 从2B的角度,开源、闭源都需要,百川智能不会只瞄准一个方向。

王小川指出了LLaMA开源模型的隐藏限制因素。他表示,LLaMA 开源模型适用于以英文为主的环境,开发者使用中文场景是拿不到开源协议,Baichuan2开源大模型更适用于中文大模型。

“我们现在可以获得比LLaMA更友好且能力更强的开源模型,能够帮助扶持中国整个生态的发展。除开源模型以外,下一次在闭源方面会有更多的突破,希望在中国的开源闭源里都能给中国的经济社会发展带来我们的贡献。”

当前大部分开源模型在开源过程中只是对外公开自身的模型权重,很少提及训练细节,企业、研究机构、开发者们只能在开源模型的基础上做有限的微调,很难进行深入研究。

王小川表示,百川智能公开了Baichuan2开源大模型训练过程中的全部参数模型,以及不同大小的 tokens、训练切片,使得学术界在进行预训练微调、强化时更容易操作,更容易获得学术经验和成果。他透露,这也是国内首次开放训练过程。

百川智能创立于今年4月10日,旨在打造构建中国最好的大模型底座,并在教育、医疗等领域应用落地。截至目前,百川智能已公布首轮5000万美元融资。

成立不到半年时间,百川智能平均每28天发布一款大模型,已相继发布了Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B。

8月31日,百川智能通过《生成式人工智能服务管理暂行办法》备案,旗下大模型可以正式面向公众提供服务。

          
  • 上一篇:“YVR”正式更名为“玩出梦想”

相关阅读

RelatedReading
  • 哈趣投影618收官荣获游戏投影机榜第1名 哈趣投影618收官荣获游戏投影机榜第1名
  • 让AI上车,车企如何借势2023上海国际车展硬核出圈 让AI上车,车企如何借势2023上海国际车展硬核出圈
  • 傲图科技完成种子轮融资,首款高性能4D成像雷达已交付使用 傲图科技完成种子轮融资,首款高性能4D成像雷达已交付使用
  • 618权威媒体电视排行榜NO.1,海信电视E8诠释MiniLED画质巅峰 618权威媒体电视排行榜NO.1,海信电视E8诠释MiniLED画质巅峰
  • 车载显示、XR虚拟拍摄AWE首展,海信视像全场景显示新品即将亮相 车载显示、XR虚拟拍摄AWE首展,海信视像全场景显示新品即将亮相
  • 作业要检查,家长没时间怎么办?试试优学派AI学生平板 作业要检查,家长没时间怎么办?试试优学派AI学生平板

猜你喜欢

Guessyoulike
眼球发红充血怎么回事(眼睛发红充血是什么导致的)

眼球发红充血怎么回事(眼睛发红充血是什么导致的)

龙鑫 3461次阅读2023-06-22 10:46
互联网电商板块涨4.35% 赛维时代涨19.99%居首

互联网电商板块涨4.35% 赛维时代涨19.99%居首

hao333 4661次阅读2023-07-21 10:27
广生堂终止不超9.5亿定增 保荐机构为兴业证券

广生堂终止不超9.5亿定增 保荐机构为兴业证券

hao333 3693次阅读2023-05-26 15:21
狂肝40小时,我逐渐理解米哈游做好大型回合制游戏的决心

狂肝40小时,我逐渐理解米哈游做好大型回合制游戏的决心

hao333 7770次阅读2023-03-30 08:44
专题页

HOT榜单

  • 收评:沪指午后回落翻绿 房地产板块全天强势

  • 午评:三大指数震荡走低 计算机应用板块涨幅居前

  • 全方位解析iPhone 15系列四款机型

  • 巨人网络涨9.99% 机构净买入1.03亿元

  • 独立新作Ravenlok开发商大赞微软XGP:100%值得加入!

  • 零工经济迅速崛起,身边云赋能企业解锁发展新机遇

  • 华泰紫金碳中和混合延长募集期

  • 岩山科技关联增资收关注函 一年半无营收公司估值20亿

  • 《街头篮球》贴吧战神集结再出发 晒出战迹赢取限定

  • 中标30万套桌面OS!统信软件成为中国邮政桌面操作系统集采项目主选供应商

换一组看看

频道最IN
>焦点科技涨5.31% 机构净卖出1.68亿元

焦点科技涨5.31% 机构净卖出1.68亿元

>盟固利龙虎榜:4家机构进卖出前5 净卖出共1993万元

盟固利龙虎榜:4家机构进卖出前5 净卖出共1993万元

>股票分时图做t买卖技巧

股票分时图做t买卖技巧

关于我们 法律声明 联系我们 广告服务 隐私条款
@老男人网 版权所有/信息产业部备案号:蜀ICP备13015099号-1