DeepSeek(杭州深度求索人工智能基础技术研究有限公司)是一家成立于2023年7月17日的创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。 公司由知名量化资管巨头幻方量化创立,创始人梁文锋曾在浙江大学电子工程系人工智能方向就读。
技术创新与产品
自成立以来,DeepSeek在大模型领域取得了多项突破:
-
DeepSeek-V2:于2024年5月发布的混合专家(MoE)模型,具有2360亿参数,其中每次推理激活210亿参数,支持最长128K的上下文长度。该模型在性能和成本之间取得了良好平衡。
-
DeepSeek-V3:于2024年12月发布,采用多头潜在注意力(MLA)架构,进一步提升了推理速度和效率。
-
DeepSeek-R1:于2025年1月20日发布的推理模型,在数学、代码和自然语言推理等任务上表现出色,性能可与OpenAI的o1正式版媲美。
开源与生态
DeepSeek坚持开源策略,所有模型均采用MIT许可证,允许用户进行模型蒸馏和二次开发。 这一开放策略促进了技术社区的交流与合作,加速了AI技术的普及与应用。
广泛应用与合作
截至2025年2月,DeepSeek的技术已被广泛应用于各个领域:
-
政务服务:广州市政务服务和数据管理局在政务外网正式部署了DeepSeek-R1和V3 671B大模型,丰富了政务服务场景应用。
-
搜索引擎:百度搜索全面接入了DeepSeek和文心大模型的深度搜索功能,为用户提供更丰富的搜索体验。
-
社交平台:微信搜一搜上线了“AI搜索”功能,部分用户可使用DeepSeek-R1提供的“深度思考”服务。
未来展望
DeepSeek以其高效、低成本的技术优势,正在重塑AI生态链。公司致力于持续推进人工智能技术的发展,秉持开放合作的理念,为全球用户提供更智能、更高效的AI解决方案。
本文发布于2025年02月17日15:06
,已经过了67天,若内容或图片失效,请留言反馈
转载请注明出处: 皮哈皮阿
本文的链接地址: https://blog.phpat.com/ai-tools/585.html
暂无评论
emlog简约社区模版发布了。
今天的你,戴口罩了吗? 没戴?小心病毒安排你跳社会摇!🕺 记得勤洗手,冲掉坏运气~ 积极防护,保护自己,晴天咱们一起当人群里最靓的仔!✨
2019加油!钱包要鼓,头发要多,烦恼要少,快乐要爆。愿你工作摸鱼得潇洒,生活撒欢得漂亮!别怕,宇宙都在暗中支持你!
人生真的是多姿多彩
不是每朵白云,都会带来真情;不是每个拥抱,都会面带微笑;不是每次思念,都能立刻兑现;不是每个朋友,都在身边守候;不是每个日子,都逢良辰吉时。国庆节到了,愿你节日快乐!
昨天和今天有什么不同
经朋友提示,Beginning模板一周年了,恭喜。 好事总会发生,敬请期待更好的作品
beginning模板越来越好了[耶]
2018是个新的开始
“生命是属于每个人自己的感受,不属于任何别人的看法。”