论文地址:
https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf5、OpenAI谷歌微软Meta联名签署AI公开信SV Angel昨晚发布一封AI公开信,呼吁“每个人都建立、广泛部署和使用AI来改善人们的生活”。OpenAI、Meta、谷歌、微软、Salesforce、Hugging Face、Mistral AI、Databricks、Scale AI、Character.AI、ElevenLabs等超过200家机构已签名,承诺“致力于建设将为人类更美好的未来做出贡献的AI”,“有共同的责任做出选择,使AI的利益最大化,降低风险”。6、ChatGPT新增文本朗读功能OpenAI今日宣布ChatGPT上线“朗读”功能,可将对话文本内容读出声。在iOS或安卓系统上的操作方式是点击并按住消息,然后点击“Read Aloud(大声朗读)”按钮。OpenAI也在网页端滚动,用户可点击消息下方的“Read Aloud”按钮。7、3D生成模型TripoSR开源 1秒将单图转3D模型Stability AI今日宣布与国内3D生成模型创企VAST合作开源了一款快速3D物体重建模型TripoSR,能在1秒内从单张图像生成高质量的3D模型。TripoSR在低推理预算下运行,对没有GPU的用户完全可用。当在英伟达A100上测试时,它在大约0.5秒内生成草稿质量的3D输出(纹理网格),优于其他开放的图像转3D模型,如OpenLRM。在MIT许可下,TripoSR模型权重和源代码可下载,允许商业、个人和研究使用。项目地址:https://github.com/VAST-AI-Research/TripoSR
技术报告:https://stability.ai/s/TripoSR_report.pdf8、53页PDF曝OpenAI的Q*模型推进时间表昨日凌晨,社交平台X上一个名为杰克逊(Jackson)的网友发布了一个53页PDF文件,名为《揭示OpenAI计划在2027年前创建AGI》。根据该文件,OpenAI于2022年8月开始训练一个125万亿参数的多模态模型。第一个阶段是Arrakis,也叫Q*。该模型在2023年12月完成了训练,但由于推理成本过高而取消了发布,这是原计划于2025年发布的GPT-5。Gobi(GPT-4.5)被重新命名为GPT-5,因为原来的GPT-5被取消了。Q*的下一阶段最初是GPT-6,但后来更名为GPT-7,最初计划于2026年发布,但因为最近马斯克的诉讼而被搁置。Q* 2025 (GPT-8)计划于2027年发布,实现全面AGI。目前还不知这个透露可靠度有多高,OpenAI未对此进行回应。文件地址:
https://drive.google.com/file/d/1xlRDbMUDE41XPzwStAGyAVEP8qA9Tna7/view9、Mac专属大模型框架上线根据社交平台X及GitHub,由一名OpenAI前员工打造的苹果电脑专属大模型框架Chat with MLX近期上线。该框架支持中文、英语、法语等11种语言,可轻松集成任何HuggingFace和MLX兼容的开源模型,只要两行代码就能完成部署,支持苹果电脑跑本地大模型。GitHub地址:https://github.com/qnguyen3/chat-with-mlx
10、英伟达市值超沙特阿美 成全球第三大上市公司 据彭博社报道,英伟达周一市值超过沙特阿美,成为仅次于苹果和微软的全球第三大上市公司。截至美东时间周一收盘,英伟达总市值为2.13万亿美元。11、潞晨科技开源Sora复现架构方案 降本46%潞晨科技昨日宣布其已经开源完整的Sora复现架构方案Open-Sora。据称,这一架构方案还可降低46%复现成本,并将模型训练输入序列长度扩充至819K patches。目前Open-Sora已涵盖:提供完整的Sora复现架构方案,支持动态分辨率,支持多种模型结构,支持多种视频压缩方法,支持多种并行训练优化。GitHub地址:
https://github.com/hpcaitech/Open-Sora12、传阿里领投MiniMax新一轮融资据创投日报昨日报道,通用大模型初创项目MiniMax正在进行新一轮大规模融资,阿里为其中的核心领投方。此前不久,另一家大模型创企月之暗面也传出了完成10亿美元规模融资的消息,据称大部分资金来自于阿里。13、联汇科技完成新一轮数亿元战略融资联汇科技2月28日宣布已完成新一轮数亿元战略融资,投资方由中国移动产业链发展基金中移和创投资、前海方舟旗下中原前海基金和齐鲁前海基金等多家头部国资与市场化机构组成。联汇科技成立于2003年,聚焦多模态数据分析、 视觉语义理解、预训练大模型、AIGC等AI技术即产业落地,目前已推出iBase向量数据库、欧姆多模态预训练大模型、OmBot自主智能体等产品。本轮融资将用于多模态大模型及自主智能体的技术研发、产品创新及市场拓展,进一步扩大在运营商、能源电力、媒体等大B行业与重点细分市场的领先优势。14、AI创企Baseten获4000万美元B轮融资美国AI创企Baseten今日宣布获得4000万美元B轮融资,由IVP和Spark Capital领投,Greylock、Conviction Partners、天使投资人Lachy Groom等参投,估值超过2亿美元。Baseten成立于2019年,主营业务是帮助客户采用经训练的开源或定制AI模型,并将其投入公共应用。客户可通过在Baseten的云上部署他们的模型,而不必设置后端基础设施。Baseten的软件会根据特定时间内AI模型的流量自动调整公司支付的计算资源数量。如果客户需要GPU,它还可以帮助获得供应稀缺的GPU。15、新旦智能完成千万级别天使轮融资据投资界报道,近日,深圳AI初创公司新旦智能完成了千万级别的天使轮融资,由全球化人工智能企业APUS与AI行业资深投资人周弘扬联合投资。新旦智能创立于2023年,由清华、伯克利、腾讯、Meta等学术与工程界精英组成,成立以来新旦智能分别用7B、30B模型在全球公认榜单MT-Bench上登顶TOP1,实现了Score:8.58,仅次于GPT-4。16、前中关村科金副总裁邓江加入百川智能据《科创板日报》3月4日报道,前中关村科金副总裁邓江加入国内头部大模型创业公司百川智能,作为商业合伙人担任金融事业群总裁职务,负责金融行业解决方案的打造以及合作生态的建立。邓江曾在中国农业银行总行、中信银行总行从事核心业务系统研发、产品设计和团队管理工作。2022年加入中关村科金,任副总裁负责金融行业线的组建,成功交付验收项目近百个。17、腾讯云AI系列产品促销 AI绘画19.9元1000次腾讯云昨日宣布推出一系列AI产品促销活动,包括语音识别、语音合成、AI绘画、数智人、人脸核身等多个领域。在首单专区,新用户购买最低0.4折,包括AI绘画服务19.9元1000次,人脸融合14.9元1000次,录音文件识别14.9元60小时等;在特惠专区,所有用户最低1.5折,包括人脸核身全场7折,语音识别全场6折,AI绘画5折起,数智人全场5折等。18、阿里推AI电商工具“绘蛙”据Tech星球昨日报道,阿里成立了一支AI电商团队,目前正在打造一款针对商家和达人的AI电商产品“绘蛙”。据悉,绘蛙开发主体为杭州连凡信息技术有限公司,该公司由阿里巴巴(中国)有限公司100%持股。“绘蛙”将为淘宝、天猫商家和达人在生成营销文案、训练专属AI模特等方面提升创作效率,助商品快速被“种草”。19、华为云盘古大模型通过标准符合性验证据华为中国官微昨日发文,在由中国信通院组织的可信AI大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得优秀级(4+级)评分,这也是本次金融大模型评测各厂商中的最高等级。华为云盘古大模型成为首批通过金融大模型标准符合性验证的产品,也是首批通过行业大模型标准符合性验证的产品。20、汤姆猫:正推进申请接入Sora模型汤姆猫3月3日在互动平台上回答投资者问:“公司正在推进申请接入OpenAI的Sora模型,并计划进行相关的素材制作的测试,目前暂未正式接入Sora。”21、始智AI wisemodel开源社区上线半年成绩单始智AI wisemodel.cn开源社区平台昨晚公布自2023年9月4日官宣上线以来的半年成绩单:wisemodel开源的模型数量达到390个,开源数据集的数量达到58个。同时,wisemodel社区正式上线了代码和算力模块,AI领域的开源项目代码也可以在wisemodel社区上同步发布。wisemodel社区于今年2月19号还发起了开源复现Sora计划,目前已有40余位来自清华、北大、上交、中科院、港科大、东京大学等国内外高校的研究成员以及来自大厂和创业团队的研究成员加入。复现计划团队分为模型组、数据组、评测组和infra组,已经分别在开展相应部分的研究和验证工作。22、海淀区与清华大学合作共建AI产业高地3月2日上午,海淀区与清华大学共建人工智能产业高地战略合作签约仪式举行。根据协议,双方将围绕打造人工智能创新平台、开展关键核心技术攻关、推动重大科技成果转化、建设人工智能人才特区、厚植人工智能产业生态等五大方面开展合作,形成新质生产力。双方协同建设人工智能产业高地,对于学校提升人工智能科技创新与成果转化、服务海淀推动智能产业升级与经济发展、助力北京市加快建设具有全球影响力的人工智能创新策源地具有重要意义。23、清华将建设100门AI赋能教学试点课程据清华大学公众号发文,2月29日下午,清华大学举行2024年全校教职工大会暨全校党员集中培训,校长李路明作学校工作报告,着重介绍了学校在AI深度融入教育教学方面的探索与布局,表示学校将建设100门AI赋能教学试点课程,并为每一位2024级新生配备“AI成长助手”。24、摩根大通AI辅助现金流模型可减少90%人工工作 据彭博社昨日报道,美国最大金融服务机构之一摩根大通集团通过其基于AI的现金流管理工具,帮助其一些企业客户在分类和可视化支付流程方面减少了90%的人工工作,不过管理流动性的决策仍需由人类做出。自大约一年前推出至今,该公司现在有大约2500名客户使用该产品。摩根大通CEO Jamie Dimon称,这项技术最终可以让客户将每周工作时间缩短到3.5天。25、谷歌创始人现身为Gemini图像生成问题认错根据社交平台X,谷歌联合创始人谢尔盖·布林(Sergey Brin)周末现身了AI黑客马拉松会场,他承认Gemini的图像生成“一团糟(messed up)”,并称推出前没有做充分的测试。谢尔盖围绕Gemini开发内幕、AGI等话题进行了近40分钟演讲,当被问到对谷歌大模型Gemini绘画此前引发种族偏见问题的看法时,他说“模型中确实有我们还没有完全理解的部分”并进行了道歉。26、OpenAI开发者关系负责人离职OpenAI开发者关系负责人洛根·基尔帕特里克(Logan Kilpatrick)当地时间3月1日在社交平台X上发文,宣布他已经离开OpenAI,他刚刚度过了在OpenAI的最后一天。洛根此前领导OpenAI的开发人员关系,支持开发人员使用DALL-E、API和ChatGPT进行开发。在OpenAI之外,他是Julia编程语言的首席开发者社区倡导者,也是哈佛大学扩展学校课程CSCI E-33A的教员。洛根之前是苹果的应用机器学习工程师和软件工程师,以及Julia编程语言的社区经理。27、AI报税聊天机器人翻车:测试题答错一半据《华盛顿邮报》报道,经测试,TurboTax和H&R Block的AI报税聊天机器人AI Tax Assist很不靠谱,在16道测试题中答错了一半,回答出无用或出错的信息。这些表现释放了一个危险信号,对于准确性至关重要的产品来说,绝不能轻信AI工具给出的回答。28、AMD对华销售AI芯片遇阻据彭博社今日报道,据知情人士透露,AMD试图向中国市场销售一款定制AI芯片时,遇到美国政府的阻碍。AMD希望获得美国商务部的批准,向中国客户出售这款AI芯片,并表示这款芯片性能低于AMD在中国以外地区销售的芯片的性能,设计满足美国出口限制。但美国政府官员告知AMD,该芯片的性能仍然太强了,AMD必须获得美国商务部工业和安全局的许可,才能出售该芯片。29、印度限制生成式AI工具发布据路透社今日报道,印度信息技术部在上周五向各平台发布的一份咨询报告中表示,包括生成式AI在内的工具使用,及其“在印度互联网上对用户的可用性,必须得到印度政府的明确许可”。印度要求科技公司在公开发布“不可靠”或正在试用的AI工具之前寻求许可,并指出它们应该被贴上标签,因为这些工具有可能对用户的查询返回错误答案。 (本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)