Forwarded from Lancern's Treasure Chest
快过年了,不要再讨论什么C++标准、CWG缺陷报告、LLVM编译器了。你带你的WG21草案、编译器补丁回到家并不能给你带来任何实质性作用,朋友们兜里掏出一大把钱吃喝玩乐,你默默地在家里摆弄你的Clang patch。亲戚朋友吃饭问你收获了什么,你说我给Clang实现了编译期反射和std::execution,可以让用户一行代码做到非侵入式序列化然后异步发起IO,亲戚们懵逼了,你还在心里默默嘲笑他们,笑他们不懂你用的C++标准,不懂你写的精妙代码,也笑他们的低端安卓手机还要跑那么慢的Java虚拟机。你父母的同事都在说自己的子女一年的收获:儿子买了个房,女儿买了辆车,姑娘升职加薪了;你的父母默默无言,说我的儿子在家又配了台大内存台式来编译Clang,开起来嗡嗡响,家里电表走得越来越快了。
【中国驻美大使馆提醒】
提醒来美中国留学生谨慎选择从华盛顿杜勒斯国际机场入境
近期,多名中国留学生自华盛顿杜勒斯国际机场入境时,遭美边境执法人员无端盘查、滋扰、并被注销签证遣返回国。这些留学生均持有合法证件,是在回国休假、赴第三国旅游或参加会议后返回美国,或在新生入学时来美,期间受到长时间询问,所携电子设备被检查,有的甚至被限制人身自由长达十余个小时,并禁止与外界联系。美边境执法人员的有关做法给中方留学人员学业造成严重影响,心理带来极大伤害。
中国驻美国大使馆高度重视维护中国留学人员安全和合法权益,已就此向美方提出严正交涉。美方频繁对中国留学人员无端盘查甚至遣返,严重损害中国公民正当合法权益,与中美元首旧金山会晤关于促进两国人文交流的共识背道而驰。我们强烈敦促美方停止错误做法,停止无端滋扰、盘查、遣返中方留学人员,切实将两国元首关于支持中美人文交流,鼓励扩大留学生规模的共识落到实处。
中国驻美国大使馆谨提醒拟来美留学人员,谨慎选择自华盛顿杜勒斯国际机场入境。同时入境美国时提高安全意识,详细了解美入境政策规定,提前做好行前准备,带齐入境资料、留存校方联系方式。如遇美边境执法人员盘查,沉着冷静,理性配合,妥善应对;如遇不公对待,请记下现场执法人员信息,认真核对须签署的文书内容并索要备份,留存必要证据,事后可通过其主管部门美国海关和边境保护局(CBP)官方网站进行投诉( https://help.cbp.gov/s/complaints/languageen_US )或通过法律途径维护自身权益,并联系中国驻美国使领馆寻求协助。
外交部全球领事保护与服务应急热线(24小时):
+86-10-12308或+86-10-65612308
中国驻美国使领馆领事保护与协助电话:
驻美国使馆:+1-202-4952216
驻纽约总领馆:+1-212-6953125
驻旧金山总领馆:+1-415-2168525
驻洛杉矶总领馆:+1-213-8078052
驻芝加哥总领馆:+1-312-7800170
提醒来美中国留学生谨慎选择从华盛顿杜勒斯国际机场入境
近期,多名中国留学生自华盛顿杜勒斯国际机场入境时,遭美边境执法人员无端盘查、滋扰、并被注销签证遣返回国。这些留学生均持有合法证件,是在回国休假、赴第三国旅游或参加会议后返回美国,或在新生入学时来美,期间受到长时间询问,所携电子设备被检查,有的甚至被限制人身自由长达十余个小时,并禁止与外界联系。美边境执法人员的有关做法给中方留学人员学业造成严重影响,心理带来极大伤害。
中国驻美国大使馆高度重视维护中国留学人员安全和合法权益,已就此向美方提出严正交涉。美方频繁对中国留学人员无端盘查甚至遣返,严重损害中国公民正当合法权益,与中美元首旧金山会晤关于促进两国人文交流的共识背道而驰。我们强烈敦促美方停止错误做法,停止无端滋扰、盘查、遣返中方留学人员,切实将两国元首关于支持中美人文交流,鼓励扩大留学生规模的共识落到实处。
中国驻美国大使馆谨提醒拟来美留学人员,谨慎选择自华盛顿杜勒斯国际机场入境。同时入境美国时提高安全意识,详细了解美入境政策规定,提前做好行前准备,带齐入境资料、留存校方联系方式。如遇美边境执法人员盘查,沉着冷静,理性配合,妥善应对;如遇不公对待,请记下现场执法人员信息,认真核对须签署的文书内容并索要备份,留存必要证据,事后可通过其主管部门美国海关和边境保护局(CBP)官方网站进行投诉( https://help.cbp.gov/s/complaints/languageen_US )或通过法律途径维护自身权益,并联系中国驻美国使领馆寻求协助。
外交部全球领事保护与服务应急热线(24小时):
+86-10-12308或+86-10-65612308
中国驻美国使领馆领事保护与协助电话:
驻美国使馆:+1-202-4952216
驻纽约总领馆:+1-212-6953125
驻旧金山总领馆:+1-415-2168525
驻洛杉矶总领馆:+1-213-8078052
驻芝加哥总领馆:+1-312-7800170
Forwarded from CosPlay R18 VR (Accelerator-in-Chief)
Forwarded from Yummy 😋
“弱智吧”不收弱智,成最佳中文AI训练语料!
4月4日,“弱智吧”突然在中文AI领域刷屏,中科院用各大社交平台的数据,作为中文AI语料数据进行训练,结果发现“弱智吧”居然是最棒的中文语料,在多项测试中取得最高分!
目前LLM大型语言模型中,英文语料占到大多数,而中文数据集此前多半是先从英文翻译再进行训练,很多大模型的中文效果比英文差,为了调侃AI,许多人也常常拿弱智吧的问题去挑战AI。为了更好地满足中文大模型的需求,中科院联合多所大学利用中文数据集来训练中文大模型。
首先,团队直接找到某乎、某瓣等社交网络平台,爬取数据并进行标注,打造了全新的中文指令微调数据集COIG-CQIA,再用这些数据集来训练零一万物开源大模型,并用GPT4在BELLE-Eval测试集上打分。
在340亿参数版本的Yi-34B下,弱智吧的分数非常突出,可以说是一骑绝尘,在问答、分类、生成、总结、摘要和代码上均取得极高的分数,数学某乎分数最高76分,但弱智吧也取得了72.6分的高分,最终均分76.9分遥遥领先!
弱智吧的出色成绩也引起了大量的讨论,对比其他专业的技术问答社区,弱智吧的数据集其实更加精炼有效,提高模型的逻辑推理能力,而且“弱智”的方向十分多元,文本质量极高,从而提高了模型性能。
而COIG-CQIA,也成为目前相对来说相当高质量的中文指令微调数据集,收集了来自各种来源如社交媒体、百科知识、考试题库等大量高质量的中文指令,弱智吧的出色表现,出在高质量中文知识学习方面的潜力,也给我们带来更多深入的思(乐)考(子)。
🗒 标签: #AI #中文预料 #弱智吧
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
4月4日,“弱智吧”突然在中文AI领域刷屏,中科院用各大社交平台的数据,作为中文AI语料数据进行训练,结果发现“弱智吧”居然是最棒的中文语料,在多项测试中取得最高分!
目前LLM大型语言模型中,英文语料占到大多数,而中文数据集此前多半是先从英文翻译再进行训练,很多大模型的中文效果比英文差,为了调侃AI,许多人也常常拿弱智吧的问题去挑战AI。为了更好地满足中文大模型的需求,中科院联合多所大学利用中文数据集来训练中文大模型。
首先,团队直接找到某乎、某瓣等社交网络平台,爬取数据并进行标注,打造了全新的中文指令微调数据集COIG-CQIA,再用这些数据集来训练零一万物开源大模型,并用GPT4在BELLE-Eval测试集上打分。
在340亿参数版本的Yi-34B下,弱智吧的分数非常突出,可以说是一骑绝尘,在问答、分类、生成、总结、摘要和代码上均取得极高的分数,数学某乎分数最高76分,但弱智吧也取得了72.6分的高分,最终均分76.9分遥遥领先!
弱智吧的出色成绩也引起了大量的讨论,对比其他专业的技术问答社区,弱智吧的数据集其实更加精炼有效,提高模型的逻辑推理能力,而且“弱智”的方向十分多元,文本质量极高,从而提高了模型性能。
而COIG-CQIA,也成为目前相对来说相当高质量的中文指令微调数据集,收集了来自各种来源如社交媒体、百科知识、考试题库等大量高质量的中文指令,弱智吧的出色表现,出在高质量中文知识学习方面的潜力,也给我们带来更多深入的思(乐)考(子)。
Please open Telegram to view this post
VIEW IN TELEGRAM