×

注意!页面内容来自https://baike.baidu.com/item/豆包/63344333,本站不储存任何内容,为了更好的阅读体验进行在线解析,若有广告出现,请及时反馈。若您觉得侵犯了您的利益,请通知我们进行删除,然后访问 原网页

豆包

字节跳动抖音子公司推出的AI助手
展开4个同名词条
收藏
0有用+1
0
豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台Windows/macOS 电脑版客户端,iOS 以及安卓平台。 [1] [24]2016年,字节跳动公司成立人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究 [6]。2023年8月17日,豆包开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录 [1]
豆包具有提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。 [1]2024年8月8日,豆包上线音乐生成功能 [3];10月10日,豆包发布首款AI智能体耳机Ola Friend [4];11月7日,豆包正式推出视频生成内测 [5] [7];12月3日,豆包已上线图片理解功能。 [12]2025年1月19日,豆包海外版Gauth: AI Study Companion在美国停服; [16]3月,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试; [21]同月,豆包测试了新版深度思考功能,支持边想边搜。 [25]8月,豆包宣布上线未成年人保护模式。 [53]12月1日,豆包手机助手发布技术预览版。 [57]
2024年5月,字节跳动产品和战略副总裁朱骏表示,豆包APP总下载量达1亿次,豆包大模型将开启商业化模式,价格相比同行便宜99.3%,定价0.0008元/千Tokens [2]。2025年4月,豆包获2024 Smart Future·AI应用标杆卓越人工智能产品奖; [42]同月,豆包入选《京王与王2025全球品牌AI战略定位50强》榜单,位列第7。 [47]
软件名称
豆包
软件平台
网页Web平台,iOS以及安卓平台,Windows/macOS 电脑版客户端 [1] [24]
上线时间
2023年 [39]
最近更新时间
2025年8月28日 [40]
软件语言
中文
软件版本
版本 10.1.1(iOS) [40](截至2025年8月29日)
软件大小
272.6 MB [40]
所属公司
字节跳动公司 [1]
模    型
云雀模型 [1]
功    能
回答问题并进行对话,帮助人们获取信息 [1]
总部地点
北京 [48]

研发背景

播报
编辑
2016年,字节跳动公司成立人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究 [6]。2022年底,大模型时代拉开序幕,字节跳动是中国投入AI力度最大的科技公司之一。 [41]

发展历程

播报
编辑
2023年8月17日,字节跳动旗下LLM人工智能机器人豆包开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录。 [1]
豆包
豆包豆包
2024年5月15日,字节跳动产品和战略副总裁朱骏2024春季火山引擎Force原动力大会上表示,豆包APP总下载量达1亿次,豆包大模型将开启商业化模式,价格相比同行便宜99.3%,定价0.0008元/千Tokens。大模型的“token”是指在自然语言处理任务中,模型所使用的输入数据的最小单元。这些token可以是单词、子词或字符等 [2];8月8日,豆包上线音乐生成功能,用户可以在豆包“音乐生成”中输入主题或歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲,并支持一键分享至抖音等社交平台。 [3]
2024年9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,火山引擎总裁谭待宣布推出豆包·视频生成模型。两款新发布的大模型分别是豆包视频生成-PixelDance和豆包视频生成-Seaweed,这两款大模型的发布意味着字节跳动首次正式宣告进军AI视频生成 [11];10月10日,豆包发布首款AI智能体耳机Ola Friend,该耳机与豆包APP深度结合,是豆包在AI场景下的探索和尝试。 [4]
Ola Friend
2024年11月7日,豆包正式推出视频生成内测,意味着继快手、商汤、Minimax等公司后,字节跳动正式杀入AI视频生成领域。豆包视频生成模型基于DiT架构,通过融合计算单元,使得视频在大动态与运镜中自由切换,并且支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域 [5] [7];12月3日,豆包上线图片理解功能。 [12]截至12月18日,豆包大模型日均tokens使用量超过4万亿。 [15]
豆包
豆包豆包
2025年1月,豆包大语音模型成为首家“引领级”通过中国信通院语音大模型能力评估的产品。 [17]
2025年3月,汤姆猫接受机构调研时表示,在底层模型上,汤姆猫AI情感陪伴机器人产品采用MoE(混合专家模型)架构,搭载了公司与西湖心辰定制的“汤姆猫情感陪伴垂直模型”,同时也调用了豆包、DeepSeek等模型的部分能力,有效增强了产品的意图识别、响应速度、数学能力等功能。 [19]3月4日,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖 285 个研究生级学科、包含 26529 道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。如今,SuperGPQA 已被用于揭示开源模型与闭源方案之间的显著性能差距,为 AI 发展提供了关键评估工具和跨学科分析框架。 [21]同月,抖音App测试接入豆包App的AI能力,并且在抖音App内为豆包App开放了两个超级入口,一个位于短视频界面,与点赞、评论、转发等功能处于同一竖列;另外一个入口则位于抖音App的消息列表内。 [22]3月12日,豆包大模型团队正式发布文生图技术报告,首次公开Seedream 2.0图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练RLHF全流程。 [23]3月28日,豆包测试了新版“深度思考”功能,该功能将推理过程的思维链与搜索深度结合,支持“边想边搜”。 [25]
2025年4月17日,豆包1.5・深度思考模型和文生图3.0模型已通过火山引擎正式开放API,供开发者和企业客户使用。 [26] [46]4月19日,字节跳动推出文本生成图像模型Seedream 3.0,文生图跑分超 GPT-4o。字节跳动计划未来将 Seedream 3.0 集成至“豆包”。 [27]4月,字节AI产品部门Flow旗下发生产品调整:社交陪伴类AI产品猫箱原负责人梁琛奇已离开字节跳动;猫箱负责人由原星绘产品负责人西原(花名)接任;同时,星绘团队计划并入豆包,将由豆包App端负责人陆游(花名)一起管理。 [28]
2025年5月23日,豆包宣布在 App 端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动。 [29]
2025年6月17日,豆包电脑版已全量上线AI播客功能。用户上传PDF或网页链接后,可一键生成双人对话的播客节目,语音效果高度拟人,对话流畅、自然。 该能力基于豆包大模型团队推出的语音播客模型。 [30]6月30日,豆包公众号宣布,“深入研究”功能已经在豆包 App、网页端、电脑版正式开启测试,用户可免费体验。“深入研究”可快速、全面处理高难度复杂任务,支持报告文档、可视化网页两种方式呈现研究结果。其适用场景包括长途旅行攻略、复杂购买决策、最新政策解读、商业科技趋势发展等所有需要海量、深度信息才能解决的问题。 [32]
2025年7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。 [33]7月31日消息,腾讯元宝,在接入DeepSeek后App下载排行榜升至第一,超过了字节豆包。 [34]
2025年8月,豆包内部正在研发测试名为“3D Model Generator”的3D模型生成工具。该工具致力于可控大规模生成模型,为创建高质量3D资产提供有力支持,尤其在游戏中的3D建模领域。 [37]8月26日,豆包正式上线未成年人保护模式。家长输入密码开启该模式后,推荐视频、浏览第三方网页、和豆包以外的智能体对话、AI创作功能将被默认关闭。 [38]9月22日消息,火山引擎推出全新通用翻译大模型——Doubao-Seed-Translation(豆包翻译模型)。该模型支持28种语言之间的相互翻译,涵盖中文、英文、日文、韩文、德文、法文、西班牙文、俄文等主流语种,满足多语言场景下的广泛需求。 [52]10月16日,火山引擎发布了豆包大模型的系列更新,包括豆包大模型 1.6 原生支持多种思考长度,并推出了豆包大模型1.6 lite、豆包语音合成模型2.0、豆包声音复刻模型2.0等全新模型。 [55]11月24日消息,豆包输入法正式上线,提供语音输入及键盘输入两种方式。 [56]12月1日,豆包手机助手发布技术预览版。 [57]2025年12月5日,火山引擎发布豆包语音识别模型 2.0(Doubao-Seed-ASR-2.0)。 [60]

功能服务

播报
编辑

综述

豆包具有提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。 [1]豆包算法是一种基于Transformer架构的语言模型,通过前文预测下一个最可能的词语来实现文本生成。 [13]

对话功能

当用户向豆包提出问题后,豆包会识别用户的需求,通过预先学习与全网搜索内容,在对话框中或落地页中展示对应的结果。 [13]

自动续写

开启自动续写功能后,只需将光标在编辑器内停留 3 秒,豆包将根据上下文,即刻生成建议内容。用户可以一键接受续写、要求重新生成或是拒绝建议内容。 [49]

AI 播客

打开 doubao.com,选择“AI 播客”,上传 PDF 文件或添加网页链接,即可生成一段双人对话播客。豆包播客的语音效果十分自然,可以模拟真人播客口语习惯,停顿、附和等细节恰到好处,去除了生硬的机器感。
工作时,可将行业报告或竞品分析链接发给豆包,立刻生成一段通俗易懂的播客。学习中,可将课程知识点等基础资料交给豆包,把文字变成对话播客,随时随地“听学习”。 [31]

图像生成

豆包支持图像生成功能。只需一句简单指令,即可一次性并行生成 20 张图像,批量创作。 [45]

AI编程

豆包支持AI 编程功能。用「AI 编程」生成的网页应用,支持在预览界面直接编辑文字、智能换图,以及选中局部元素进行调整,让零编程基础的用户也能搭建应用。 [45]

深入研究

2025年7月,豆包“深入研究”功能已经在豆包App、网页版及电脑版正式开启测试,用户可免费体验。将豆包更新至最新版后,打开App或电脑版,选择“深入研究”,输入详细指令或一句话prompt,等待几分钟,即可生成一份报告。使用豆包App生成报告后,还可以打开报告内容,选择右上角“听”按钮,一键转成播客,随时听。 [44]

AI云盘

AI云盘支持多格式预览试一试无论是 PDF、Word、PPT 还是 Excel,都可以在AI 云盘中直接预览,无需下载打开。支持多达 42 种办公文件格式预览,查阅资料更高效,处理文档更顺畅。 [49]

会议纪要

会议纪要智能章节已支持以子章节形式分段展示议题内容,结构更分明。 [49]

语音通话

电脑版语音通话功能中,可以通过首页技能栏、电脑版启动器与豆包悬浮头像一键启动语音通话。豆包不仅能表达丰富情绪、切换多样声线,还能说方言、唱歌以及模拟角色,带来更智能的语音互动体验。 [49]

脑图

豆包支持在自由对话中生成脑图、思维导图、流程图和时序图等。在脑图组件中,用户可以通过代码形式查看脑图总结的信息。 [49]

数据分析

在数据分析功能中,可一键实现数据合并去重、格式转换、数据分析以及图表绘制等操作,让数据工作变得更简单。 [49]

核心技术

播报
编辑

算法

豆包提供以AI对话为核心功能的技术服务,豆包接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,模型采用对话格式,可以根据输入的指令,通过自动化分析后生成参考信息。豆包大模型算法是一种基于Transformer架构的语言模型,通过前文预测下一个最可能的词语来实现文本生成。其中运用的技术主要是基于Transformer架构的语言模型和基于人类反馈的强化学习,前者建模了蕴含在自然语言中的知识,后者使得模型可以通过对话方式提供合适的内容。豆包大模型算法在用户提出问题后,识别用户的需求,通过预先学习与全网搜索内容,在对话框中或落地页中展示对应的结果。该模型首先通过大规模无监督的预训练学习语言的统计规律和知识,然后进行有监督的微调让模型学会遵循用户的指令,最后通过强化学习训练让模型生成合适的内容。 [43]

大模型

部分模型
模型名称
模型应用场景
豆包大模型
主要应用于豆包端内的文生文、搜索等功能
豆包文生图模型
主要应用于豆包端内的AI文生图功能
豆包视频生成模型
主要应用于豆包端内的AI视频生成功能
豆包音乐模型
主要应用于豆包端内的AI音乐生成功能
参考资料: [43]数据截至2025年8月29日

核心团队

播报
编辑
豆包备案信息为北京春田知韵科技有限公司,该公司成立于2023年7月26日,注册资本100万元,法定代表人为严林,由北京抖音信息服务有限公司全资持股 [8],经营范围含计算机系统服务、数据处理服务、软件开发、数字内容制作服务、网络文化经营等。 [9]
字节机器人团队隶属于字节AI Lab,其负责人是AI Lab总监李航。李航于2017年加入字节,向字节副总裁、算法技术负责人杨震原汇报,曾担任华为诺亚方舟实验室主任和首席科学家。 [10]

配置要求

播报
编辑
豆包支持网页Web平台,iOS以及安卓平台,但iOS需要使用TestFlight安装,用户可通过手机号、抖音或者Apple ID登录。 [1]

重要事件

播报
编辑

隐私问题

2024年12月10日,有报道曝光了一位网友被陌生人用AI搜出微信号的经历。该网友称,陌生人在字节跳动旗下AI产品豆包中输入她的名字和学校后,豆包显示了她的微信账号,并通过该微信号联系到她本人。对此,豆包相关负责人回复,网友反馈的情况,是豆包基于互联网上公开信息进行搜索和智能整合,此类联系方式通过搜索引擎也能够搜到。豆包已对询问个人信息类提示词进行优化,保证即使网上有公开信息的情况下,仍然限制相关信息的露出,做好个人隐私信息的保护。后续,豆包还会继续优化产品策略,避免对用户造成类似的误解和困扰。 [14]

停服事件

当地时间2025年1月19日,苹果美国官网发布《关于TikTok及字节跳动有限公司应用程序在美国的可用性》声明指出,声明称,苹果有义务遵守其运营所在司法辖区的法律。根据相关法案,自2025年1月19日起,字节跳动及其子公司开发的应用程序,包括豆包:AI学习伙伴(Gauth: AI Study Companion)等,将不再可供美国用户在App Store上下载或更新。 [16]

合作交流

2025年2月13日,莲花跑车中国官方发文宣布,豆包AI助手将上车,宣称“原生能力深度融合 [18]同年8月,小米浏览器已升级“AI搜索”功能,通过接入豆包大模型及火山方舟高代码智能体产品,进一步提升了AI搜索的效率与服务丰富度。 [35]2025年8月,特斯拉与字节跳动旗下火山引擎达成合作,由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。根据特斯拉中国官网更新的《特斯拉车机语音助手使用条款》,特斯拉车机语音系统将同时接入字节跳动旗下的“豆包大模型”和深度求索旗下的“DeepSeek Chat”。其中,豆包大模型将提供语音命令功能,如导航、媒体播放、温度控制等。此外,豆包大模型还可支持语音查询车主手册。 [36]

阿里夸克的对话助手与豆包部分功能接近

2025年10月23日,近日曝光的阿里夸克“C计划”首款产品正式揭晓。夸克上线对话助手,采用的是Qwen最新闭源模型。从产品形态上看,夸克确实像“塞进来”一个豆包。在夸克App首页,点击助手模式或者右滑,即可进入对话助手。除了常规问答外,夸克对话助手集成了深度搜索、拍照搜题、AI 写作等核心功能,还可调用扫描、修图等各类工具。上述功能与豆包所提供的功能接近,但在拍照搜题、信息查找等场景,夸克有更长时间、更深的积累。夸克成为国内首个将搜索能力与对话体验融为一体的AI产品。 [54]

“豆包助手”手机微信登录出现被动下线

2025年12月3日,一位刚拿到豆包与中兴合作的nubia M153工程机的用户表示,测试过程中出现无法登录微信的情况,微信页面显示“你的微信登录环境存在异常。为了账号安全,请更换设备重新登录。”该用户更换微信账号重新尝试登录后成功,但在传导聊天记录过程中,再次出现被动下线的情况。另一位nubia M153体验用户表示,当天早上发现工程机上的微信已自动退出,重新进行信息输入后可以正常登录。字节跳动与腾讯微信方面未发表回应。 [58]

回应高危权限

2025年12月,有市场消息称,实测搭载豆包手机助手的努比亚手机发现,豆包有安卓权限定义中的操作系统高危权限INJECT_EVENTS(注入权限/注入事件),而该权限允许应用向系统注入模拟的用户输入事件。在黑客突破操作系统限制的场景中,拿到这个权限甚至要面临侵入计算机系统这类刑事责任。对此,业内人士对《每日经济新闻》记者表示,INJECT_EVENTS 是手机助手常用的系统权限,小米小爱、荣耀yoyo等手机厂商原生助手也拥有该权限。豆包手机助手是通过和终端手机厂商合作获得该权限,并在其隐私白皮书、权限清单中进行了彻底披露。该权限可以让助手模拟点击事件,完成任务。豆包方面对每经记者回应称,手机助手执行任务需用户授权,在执行过程有明确的展示,且用户可以中断。操作手机能力由用户触发、用户监督,并不自动执行。 [59]

品牌价值

播报
编辑
所获荣誉
时间
评选方
所获荣誉
2025年4月
华尔街见闻
2024 Smart Future·AI应用标杆卓越人工智能产品奖 [42]
数据截至2025年8月29日
榜单排名
时间
评选方
榜单名称
名次
2025年4月
京王与王
京王与王2025全球品牌AI战略定位50强
第7名 [47]
数据截至2025年8月29日

影响评价

播报
编辑

影响

2025年3月,中国经营报发表《官宣:停止运营!大模型革了翻译软件的命》一文表示,因受到包括DeepSeek、字节豆包、阿里通义等大模型影响,传统单一翻译软件停止运营。 [20]截至2025年6月,豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校。 [50]

评价

纵观市面上再能整活的AI,大部分顶多还是在言语上够犀利。但豆包厉就厉害在,与它对话几乎毫无违和感,甚至就是有种跟真人聊天的既视感。 [51](新浪财经 评)