国产自研通用大模型砭石;GPT-4.5默默上线?OpenAI向所有ChatGPT Plus用户开放记忆功能;苹果推理解、转化模型

chatGpt在线2024-05-01 08:40:0528

1.国产自研通用大模型「砭石」实力迈向AGI

全球领先AI公司智慧眼发布了自研的通用大模型——砭石,海量代码文本数据训练后展现出强大的涌现能力,不仅能实现代码生成,韵律创作,甚至是多模态AI理解效果惊人。

2.GPT-4.5默默上线?推理碾压GPT-4网友震惊

就在昨夜,整个AI社区都被一个神秘大模型震撼到了:它名为gpt2-chatbot,性能直接超越很多开源模型和GPT-4!网友们展开猜测,有说它是GPT-4.5的,有说是GPT-5的,还有人猜它是GPT-4+Q*,或GPT-2+Q*。奥特曼也卖起了关子:「我确实对gpt-2gpt2情有独钟。」

3.全球首次,湿实验证实!上交成功实现「蛋白质功能定向进化」,零数据跨入AGI时代

洪亮课题组设计了一种微环境感知图神经网络(ProtLGN),能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分布,用于指导蛋白质氨基酸位点设计,最终实现蛋白质指定功能的提升(定向进化)。

论文链接:https://pubs.acs.org/doi/10.1021/acs.jcim.4c00036

4.「非常接近GPT-4」的WizardLM-2被微软紧急撤回

团队的解释是:我们不小心遗漏了模型发布流程中的一个必要项目 — 毒性测试。这是目前所有新模型都需要完成的一个步骤。

5.在12个视频理解任务中,Mamba先打败了Transformer

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究团队发布了一项开创性工作。他们全面审视了 Mamba 在视频建模中的多重角色,提出了针对 14 种模型 / 模块的 Video Mamba Suite,在 12 项视频理解任务中对其进行了深入评估。结果令人振奋:Mamba 在视频专用和视频 - 语言任务中均展现出强劲的潜力,实现了效率与性能的理想平衡。这不仅是技术上的飞跃,更是对未来视频理解研究的有力推动。

  • 论文标题:Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
  • 论文链接:https://arxiv.org/abs/2403.09626
  • 代码链接:https://github.com/OpenGVLab/video-mamba-suite

6.OpenAI向所有ChatGPT Plus用户,开放“记忆”功能!

4月30日凌晨,OpenAI在社交平台宣布,向所有ChatGPT Plus用户开放“记忆”( Memory )存储功能。

用户通过开启该功能,可以使ChatGPT记住那些冗长、繁琐的内容,而不必每次打开对话框进行重复的提问。

这对于写小说、长期健康追踪、企业规划/管理、社交媒体营销、教育等行业帮助巨大。开启记忆存储的ChatGPT,才是真正的AI助手。

7.苹果推出理解、转化模型ReALM,性能超GPT-4

苹果的研究人员推出了一种创新模型ReALM,可将参考解析问题转化为语言建模问题,能极大提升AI助手处理很多描述复杂或模糊不清的内容。

例如,我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品,然后告诉AI助手只结算水果。这时传统的AI助手可能会将橘子和橘子汽水混淆进行一起结算。

而ReALM模型会重建手机或者PC等平台上的屏幕关键信息,并将其转化成一种可理解的文本,再用大语言模型去解读用户的需求,这样就可以提升操作的准确率避免出现错误。

根据测试数据显示,ReALM的性能全方位超越了同类模型MARRS;10亿参数和30亿参数在三项测试中超过GPT-4,Unseen测试几乎差不多,这也提现了ReALM非常强悍的理解和转化能力。

论文地址:https://arxiv.org/abs/2403.20329

8.谷歌因Imagen AI模型涉及版权侵权遭遇集体诉讼

根据向美国加州北区地方法院提交的诉状,Imagen是一种文本到图像的AI模型,其训练涉及复制数十亿张图像。

9.英伟达黄仁勋称AI不会完全取代人类工作

黄仁勋表示,公司收益是同生产力一起增加的,自己从未见过哪个公司在盈利增加的同时,没有雇佣更多员工。

10.英国《金融时报》与OpenAI达成协议

据金融时报介绍,OpenAI旗下产品聊天机器人ChatGPT的用户将可以看到其文章的摘要、引用和链接。OpenAI将可以使用FT的资料,来帮助开发生成式AI技术。

11.Llama3与SigLIP打造的多模态模型Bunny发布

多模态模型Bunny系列是一套强大的开放模型,尤其在MMMU基准测试中,其性能表现优秀。这是该团队基于Llama3 8B发布的首款开放模型。这个系列的模型采用了SigLIP与Llama3的技术,充分展示了其强大的性能和应用广泛性。在实现多模态交互的同时,也在各种复杂环境中的表现出色。

https://huggingface.co/BAAI/Bunny-Llama-3-8B-V

本文链接:https://www.joeyce.com/chatgpt/254.html

相关文章

网友评论