- 0
- 0
- 0
分享
- AI+出版,让书中的内容“活”起来
-
原创 03-25
近期,国内出版融合头部企业数传集团成功开发出版行业首个大模型——BooksGPT,将AIGC技术应用在出版行业,赋能出版业全流程数智化转型升级。1~2月份,该集团营业收入同比增长超60%。这一成绩引发了行业的广泛关注。
“数字员工”系统界面
随着技术发展,AI文学创作已经从理论探讨走向了实际应用阶段,不仅为出版业带来了前所未有的机遇,也带来了诸多挑战。
AI工具助力出版优化增效
随着大模型越来越“聪明”,国内出版企业及相关科技公司开始投入更多力量,积极寻求在产品研发、标准制定等多个领域展开深化合作,试图借助AI打造“出版+人工智能全系产品/服务”,形成出版机构独有的数字经济时代的“新质生产力”。
◆ 贯穿出版业全流程的大模型
由数传集团开发的出版行业首个大模型BooksGPT,将AIGC技术应用在出版行业,推出“数字员工”,赋能出版业全流程数智化转型升级。据介绍,这一模型由数传集团基于自家RAYS出版融合云平台深度研发,集成的“数字员工”成为编辑人员的“好搭档”,可实现“一岗多能”,共同在岗位上发光发热。
出版业务分为编、印、发几个关键节点,“数字员工”可以深度参与每一个环节。选题策划环节,可以替代以往人工的资讯信息查找、收集和分析,为图书选题做好相关信息储备;还能进行自动化的市场研究、竞品分析,撰写翔实、完整的选题报告,整个环节提效达到70%~80%。内容创作环节则可提供撰写提纲、创作内容、准备素材、加工润色、优化稿件结构等服务。此外,在设计环节,“数字员工”还是一位经验丰富的美编,具备迅速、低成本地创作和图书相关的各种类型图片的能力,辅助设计师高效地设计出美观、易读、符合规范的封面、插图,辅助进行版式设计和排版,出图效果媲美有5至8年经验的美编。据了解,“数字员工”翻译3000字外文内容仅需2分钟,有别于翻译软件,它能很好地保留原文稿的语言风格和思想内核,还能保持原文档的格式输出,便于比对,也减少重新排版的时间。
产品营销环节,数传集团已经训练出非常成熟的发行营销AI助理,不仅能在各个新媒体渠道进行营销推广,实现即时营销文案撰写、短视频和直播内容自动生成、平台运营政策快问快查,更能通过算力对大数据进行分析计算,精准描绘用户画像,为读者进行个性化推送。
中国知网发布的出版传媒行业大模型是基于知网知识增强大模型(未来将基于与华为共研的华知大模型),融入知网高质量知识资源和出版机构自有数据资源,采用增量训练、局部微调、知识嵌入、外挂知识库等增强机制和手段,有效解决大模型生成内容不精准、专业性差、可信度低的问题。
依托出版传媒行业大模型,知网对腾云全流程数字出版平台进行全新的智能化改造,将各类AI工具融入到数字出版流程中,为出版机构提供AI检索、AI选题策划、AI辅助写作、智能排版、智能审校、AI阅读、AIGC检测等服务。
在选题策划环节,提供出版热点分析、出版主题推荐、书名/篇名策划、写作大纲设计、作者推荐等AI智能服务。在稿件审校环节则提供内容审校、体例格式检查、知识性检查、AI生成检测等方面稿件审校的智能辅助,提高编辑人员审校工作强度,提升审校工作效率。此外,针对出版运营环节,还提供网络推文、通知公告、短视频脚本、PPT大纲等文案智能创作,小红书、微信公众号、知乎、公文等各类文案之间的风格转换,文字的中英互译,文稿内容的总结摘要,根据文字内容推荐配图,智能检索出版营销数据等服务。
◆ “AI作家”,成为作者的最强辅助
中文在线发布的AI辅助创作大模型“中文逍遥大模型”是万字创作大模型,具备强大的故事生成能力,创作者只要简单输入灵感构思,甚至一张图片,3~5分钟就能自动生成一篇逻辑清晰、语句顺滑的万言小说,并可实现一次读懂100万字小说。此外,“中文逍遥”大模型还具备 “体系设定”“文学评论”“通识问答”“插画师”等功能,能够为不同需求的创作者提供强力辅助。
中文在线,赞9
作为内容行业垂类大模型,“中文逍遥”大模型经过了百万级正版中文文学数据的训练,因此在故事型内容创作上具备通用大模型难以匹敌的优势。“中文逍遥”大模型无论在故事篇幅,还是文字流畅度、内容丰富度上都比ChatGPT更懂中文创作,达到业界领先水平,有望成为中文创作第一模型。
近期,APUS联合战略合作伙伴波形智能发布了共同研发的新一代中文创作大模型,并对APUS“萤火小说”产品进行了升级迭代,进一步解决了常见网文的“模型幻觉”痛点,如小说情节链重复、可信度与流畅度不佳和人设崩塌上下文不一致等。目前该模型已经运用在APUS自身产品萤火小说上,提升了APUS在中文内容创作的精细化程度和专业性。其原生支持个性化知识库,通过自研向量数据库训练而成,显著提升了内容召回的利用率达50%,并运用RAG+仿写技术首次让AI实现“越写越懂你”的个性化交互体验。
阅文集团发布的网络文学行业第一个网文大模型“阅文妙笔”和基于这一大模型的应用产品“作家助手妙笔版”,通过内容灵感、场景创作、知识服务等创作辅助,为作家节约大量冗余、枯燥的工作。
在“作家助手妙笔版”上选择作品类型(仙侠/都市)、性别、类型(正派/反派/中立)、标签(谋略/天才/稳健/善良/忠诚……)之后,输入自己对角色的大概设想,即可获得AI生成的角色称号、称号来源、势力、外貌、性格、功法、经历等信息。
AI按照作家设定生成的角色
同时,该应用也可以按照作者的要求来画人或场景,甚至可以为世界观宏大的仙侠小说绘制地图。
AI按照作家设定绘制的场景
德国的Inkitt出版公司基于其爱情小说推出短视频版移动平台GalateaTV,平台上提供“选择音频主播”、图画小说生成器“人物聊天机器人”(Character chatbot),以及内容摘要等AI工具。该公司还计划使用大语言模型生成个性化小说,使用DeepL进行机器翻译,生成适合读者不同需求的有声书、视频和游戏。
◆ 专业“找茬”,练就“火眼金睛”
蜜度发布了国内首个智能校对领域大模型“蜜度文修”,大幅提升中文校对和润色能力的智能化程度。除了刷新多类校对任务的最佳效果之外,完善了过去较为薄弱的易混词细微语义辨析难题,同时在尊重原意表达的基础上,更好地修正句式杂糅、逻辑错乱等问题,使句子表达更流畅,实现对句子的润色功能。
“蜜度校对通”对内容进行润色
星图比特自主研发的创新型AI校对产品,其搭载的大语言模型对出版刊物、新闻稿件、法院文书、文件文稿、总结报告等场景中的文字语法错误、敏感词错误、网络热词等进行审校排查和分析,结合“多审多校”功能全方位提升文本质量,降低差错概率。
◆ AI+出版的小众玩法
中华书局旗下古联(北京)数字传媒科技有限公司发布了“荀子”古籍大语言模型,实现自然语言理解、自动翻译、诗歌生成、自动标引等功能,主要应用于生成古籍索引与摘要、文言到白话翻译等场景。
果麦文化传媒股份有限公司携手爱漫阁(上海)智能科技有限公司,发布了国内首款专业动漫图文模型与AI工具1.0版本,基于爱漫阁海量的专业动漫领域垂直数据集以及完全自研的多模态模型,漫画创作者可以用极简操作完成草稿勾线、线稿上色、场景生成等多种工作。
模型解决了“运用主流大模型进行线稿填色时,会产生的非常明显的AI感”这一普遍问题
在“动态内容”方面,爱漫阁的技术团队目前已经取得了阶段性成果。通过Cinemagraph技术的优化,创作者只需简单的镜头方向指示互动,就能够让静态图像的一部分变为动态。
英国的Shimmr.ai公司,在图书营销领域独树一帜,专注于利用AI技术进行精准推广。该平台使用NLP技术,从类型、情节、主角、大反派、主题、情感等方面分析作者的叙事技巧和故事的情感走向,由此向不同读者推荐感兴趣的图书。从分析到推荐分为三步,第一步是基于结构和价值、兴趣、情感三要素(VIE)提取图书DNA。第二步是生成营销文案,并自动生成符合消费者需求的、多媒介形态的标签和关键词。第三步是推送给需要的消费者。
◆ 版权确权,为创作保驾护航
为了更好地记录AI生成内容的创作过程和版权信息,确保内容的真实性和版权归属的明确性,龙源数字传媒集团基于大模型AI和版权文章库研发了知识发现与创作平台“文可知识文库”,为AI生成的内容提供版权确权服务。
文可知识文库
南京广播电视台自主研发的天权区块链内容溯源平台,利用区块链技术,将文章、图片、音视频、创意作品等文化资产上链存储,平台用户可根据作品名称、作者信息、作品唯一标识、作品电子文件等数据在江苏版权服务平台确权,确权后可在北京、广州两大互联网法院及北京、江苏版权协会官网进行核验。
用户在发生被侵权行为时,可直接将天权存证证书及确权后的著作权登记证书作为证据提交至法院或行政机关,在后续确定侵权行为及赔偿过程中可以更好保护用户权益,同时大大降低用户搜集的时间成本。
去年12月20日,中国音像与数字出版协会发布《出版业生成式人工智能技术应用指南》团体标准,规定了出版业应用生成式人工智能技术的基本原则、主要应用场景和相应的保障措施,自2024年1月20日起开始实施。新标准的出台,为出版机构应用生成式人工智能技术提供了重要指导,这也意味着,出版人在新技术探索的下一环节中,从政策变化、监管深化,再到产业转型、动能转换,组织管理将持续迎来更深入的变革与思考。
用好AI这把“双刃剑”
AI技术正以其强大的数据处理和学习能力逐渐渗透到出版业,然而,技术的革新并非总是一帆风顺。
前段时间《纽约时报》对OpenAI和微软公司提起的诉讼,无疑给这场“AI进军出版业”的浪潮投下了一颗重磅炸弹。近期广州互联网法院就一起生成式AI服务侵犯他人著作权案作出生效判决,这是我国继2023年11月北京互联网法院对“AI文生图”著作权侵权纠纷作出裁判后的又一例在人工智能领域的司法判决。另据公开报道,截至2024年2月24日,美国已发生了10余起与生成式AI相关的著作权侵权纠纷。
这些事件引发了行业内外的广泛关注,也让人们开始重新审视AI在出版业的应用及其可能带来的问题。
出版业承担着传播知识、文化和价值观的重任,然而AI技术的快速发展也带来了著作权和数据安全的双重挑战。AI内容生成涉及大量数据处理和学习,可能不经意间侵犯他人著作权,引发法律争议。同时,AI在收集处理用户数据时,也存在泄露和滥用风险,威胁用户隐私安全。因此,在利用AI技术时,我们需强化监管意识,建立数据安全管理和著作权保护制度,确保AI应用合法合规,避免潜在的法律风险和社会问题。
而且AI生成的内容虽然以其高效快捷的特性为出版业带来了便利,但所生成的内容也可能存在信息失实、误导读者的情况。由于缺乏人类的判断力和审慎思考,AI在处理信息时可能无法准确识别并剔除错误或误导性的内容,内容逻辑性、细节处理等问题上依然存在不足,导致所生成的内容与事实不符或存在偏差。为了确保所发布的信息真实可靠,从业者必须加强审核和校对环节,对AI生成的内容进行严格把关。
通过加强监管、完善制度以及严格审核校对,就能更好地利用AI技术为出版业服务,为读者提供高质量的内容。在既能享受AI技术带来便利的同时,又能确保行业的健康发展。
(本文封面图由豆包AI生成)
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文由 文化科技融合汇 授权 数艺网 发表,并经数艺网编辑。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 本站部分文字及图片来源于网络,如侵犯到您的权益,请及时告知,我们将及时处理或删除。