近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。
1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。
苹果美国区应用商店
苹果AppStore中国区免费榜
DeepSeek是啥?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
近日,DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。
纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。
低成本实现高性能模型研发,对用户来说体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。
据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。
有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
1月26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
团队不到140人
创始人来自湛江
据悉,DeepSeek创始人梁文锋来自广东省湛江市,本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域。
近日,梁文锋还现身《新闻联播》,以DeepSeek创始人的身份参加了一场座谈会,并现场发言。
梁文锋(左一)
在团队配置上,DeepSeek团队最大的特点是名校、年轻。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。
来源:澎湃新闻(记者 李潇潇 胡含嫣)、北京日报(记者 孙奇茹)、长安街知事、中国新闻社
近日,法大大与企业绿色发展研究院联合发布了《2023年签约减碳与低碳办公白皮书》,该白皮书基于《低碳办公评价》标准倡导的创新减碳技术应用方向,深入剖析企业低碳办公场景及签约减碳价值。为践行“双碳 为深入学习贯彻党的二十大精神,贯彻落实习近平总书记对深入开展学雷锋活动作出的重要指示精神,大力弘扬雷锋精神和志愿服务精神,在第61个“学雷锋纪念日”即将到来之际,焦作市马村区武王街道开展“学雷锋 近日,奔驰宣布放弃全面电动化目标,与宝马合资在华成立充电公司,共同运营超级充电网络,满足中国客户对豪华充电服务的需求。注册信息显示,新公司的两大股东分别是华晨宝马汽车有限公司和梅赛德斯-奔驰(中国)投资有限公司,股比 南方财经全媒体记者张雅婷 广州报道近年来,广东汕头大力发展以国际数据传输为核心的数字经济产业,于2014年9月设立的华侨经济文化合作试验区(简称“华侨试验区”)是全国唯一一个以“华 南方财经全媒体记者 欧雪 深圳报道今年,中国外贸将迎来更加复杂严峻的外部形势。商务部部长王文涛此前在新闻发布会上表示,今后将扩大优质消费品、先进技术、重要设备、关键零部件进口 2024年3月8日(星期五)上午9时,十四届全国人大二次会议第二次全体会议将在人民大会堂举行。 记者可凭会议制发的记者证件提前90分钟起,从人民大会堂东门南侧第一个门经安检入场,凭二楼记者证件在大礼堂二楼前三、五、七区“ 。本文链接:超越ChatGPT,中国“神秘力量”火爆全球http://www.sushuapos.com/show-1-34240-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 巴黎又一古建遭火灾,三十米高钟楼被烧毁