AI鬼畜攻占B站：一条播放数百万UP主年更变月更

时间:2024-06-18 浏览次数:663

　　在AI音乐创作神器Suno的加持下，UP主“鸽潭一姐”今年4月在B站发布首条视频《Suno AI热唱【萨菲罗斯男人中的男人】》，就斩获了近500万播放量。

　　萨菲罗斯是日本游戏最终幻想7中的热门角色，面对这首相当魔性的AI生成角色主题曲，熟悉游戏的网友大呼崩溃——难以想象萨菲罗斯顶着这么伟大脸以谐星身份出圈了;不熟悉游戏的网友也感到汗颜——是圈外人路过都要被硬控三分钟的程度。

　　被AI二次加工的网络热梗不只是“萨菲罗斯男人中的男人”，还有英雄联盟知名主播Otto的热梗“白银圣经”。

　　“白银圣经”是英雄联盟知名主播Otto某次直播的一段话，一时间成为网络热梗，攻占鬼畜区。而现在，这段话在Suno的加持下成了一首歌，视频《【AI音乐】白银圣经（Suno AI）》在B站播放量近40万，而这些都来自AI工具Suno的“一键生成”。

　　由于AI创作工具只需输入文本提示词、选择特定风格流派，即可在短短几秒内制作出带有人声的歌曲，很大程度上降低了鬼畜视频制作的玩梗门槛。

　　当然，如果说AI生成鬼畜音乐还不够典型，那么在B站网友更熟悉的影视二创配音领域，AI也占据了一席之地。

　　早在去年11月，B站UP主“女孩为何穿短裙”（以下简称“短裙”）就发布了一条使用AI语音技术制作的鬼畜视频，引起不少热议。

　　“女孩为何穿短裙”是一名拥有超230万粉丝的知名鬼畜区UP主，曾因《浙江温州江南皮革厂倒闭了》一战成名，被众多B站网友称为“鬼畜皇帝”。

　　在这条视频中，“短裙”利用AI配音软件，模仿84版《三国演义》中演员音色，上演了一出“三国版盗梦空间”。

　　鬼畜视频相比于画面呈现更注重音频效果，在视频制作时通常会使用简单的抠图贴片来展示不同的人物，而其粗糙的贴片质量也起到了戏谑荒诞的效果，成为鬼畜视频的一大特征。

　　现如今有了AI换脸的存在，创作者们可直接利用AI将人物“换脸”，如下图所示，利用AI将F1车手的脸换为鬼畜文化的代表人物，达到荒诞抽象的效果。

　　音频效果和画面呈现，两个鬼畜视频最重要的组成部分，现在都能使用AI完成。鬼畜视频，这种以夸张、重复和幽默为特征的独特创作形式，似乎也迎来了AI时代。

　　以音视频制作方式分类，传统鬼畜内容一般分为三大类:音MAD+鬼畜调教+人力VOCALOID。这三类虽然都以视频形式呈现，但对于大部分观众和创作者而言，鬼畜视频的精髓在于音乐。

　　AI未出现之前，鬼畜音乐的制作一般包括寻找素材、素材截取、对轨、调音和混音等环节。创作者需要先在网上自行收集大量素材，再使用UTAU等电子歌声合成软件，将素材制作成声库，而后进行调音和混音。

　　相比于最早期的鬼畜视频，这时候鬼畜视频制作被称为人力VOCALOID，已经节省创作者大半精力。这一时期，鬼畜区诞生了着名的金坷垃、面筋哥等声库，而鬼畜创作者们也使用这些声库创作了大量歌曲翻唱。

　　B站鬼畜区UP主“永远的MG”（以下简称MG）工科出身，正职是一名程序员，大学期间兴趣使然开始做鬼畜视频。

　　他对AI始终抱着一种“开放的态度”，在视频制作中也会时常用到AI，他告诉我们，现在创作鬼畜视频可以在每个阶段都借助AI，从素材整理到最终混音，都有相对成熟的AI工具可以加以使用。

　　在素材整理阶段，AI可以做到两件事，一是在茫茫素材中“大海捞音”，以便创作者后续进行调音和混音，二是可以直接借助AI生成语音素材。

　　对于人力VOCALOID制作而言，“AI几乎简化了99%的时间，它会帮你直接把素材切割成音频，不需要手动地去寻找一个特定的音”，MG向我们透露。

　　“调音的话，我比较享受自己调的过程”，MG说道，“但混音是我的弱项，在这方面借助AI的频率比较高。”

　　MG介绍说，现在的AI混音总体有两种，一种是固定风格的混音，另一种是模仿混音。AI模仿混音是指向AI输入一首曲子作为样本，AI会加以分析样本曲目的混音技巧，再套用至创作者的曲子中。

　　鬼畜调教，也叫鬼畜Rap，通常通过剪辑、拼接和处理原始素材（如影视作品、新闻片段、动画等）对严肃正经话题进行解构重组，采用戏谑无厘头的搞怪方式进行新的创作。

　　B站UP主“伊丽莎白鼠”创作的“成龙劝学”就是对动画《成龙历险记》每集最后成龙大哥的“成龙说”进行了“调教”。

　　鬼畜剧场如“华强买瓜、范志毅点评”等与鬼畜调教类似，此前在抖音大火的猫meme视频，也可以被看作是鬼畜剧场。鬼畜调教注重音乐节奏感，鬼畜剧场侧重于戏剧化的剧情。

　　这两种类型都需要在海量的人声素材中找到那一个“字”再进行加工，AI在这方面能起到的作用，就是MG提到的“生成语音素材”。

　　AI在这个阶段于创作者而言，是一种提高效率的绝佳工具，正如短裙在视频简介处写的那样，“很长时间没有更新了，主要还是因为懒。用上了AI之后大大减轻了视频工作量，所以就做了。”

　　去年11月，他曾在微博发文谈及AI对鬼畜内容创作的影响:“比如鬼畜的拼字，以前需要一个个字切下来组合，现在AI直接一键生成了都，质量还好得很，我的语音库里上百份音源以及熟练的拼字技术在此瞬间成为了笑线月，他也在微博中聊到AI对鬼畜创作效率的提升，提到“跟甲方沟通，都已经跳过脚本阶段了，因为

　　鬼畜拥抱AI，是好是坏?借助AI完成的视频，到底还是不是鬼畜?鬼畜的内核有没有在技术进步当中丢失?在“洛温阿特金森”看来，AI对于鬼畜而言没有坏处，他认为AI一来能够让话更流畅，观众的听感更好，二是

　　能够缩短UP主的制作周期，UP主可以更高效地去尝试自己的想法，试错成本大幅降低，三是AI做出的东西可复制，UP主只要利用模型就可以做出视频。“我想不出AI有什么坏处，因为我把AI看作是软件，就像调音软件一样，调音软件在慢慢地进步，在帮助你减省操作，帮你做得越来越好听，这些大家能够接受，那么现在有一个能够帮你实现阶级式跨越的软件，也是帮你做得越来越好听，为什么要对这个软件那么排斥呢?”“洛温阿特金森”在视频中聊到。

　　这种表达所能带给观众的情感共鸣，是创作者通过巧妙编排和投入情感实现的，AI改变不了，也无从下手

　　“就像做饭一样，大家用的锅可能是流水线出来的，但是你炒的这个过程总归是带有你自己的色彩的。”MG说道。真正能打动观众的，从来不是形式，而是内核

　　如果所有人都依赖AI，创作的同质化和过度依赖问题可能会更加严重，最终会不会导致整个创作生态的困境?

　　对此MG认为，一项AI技术刚刚开始投入应用时，一定存在劣币驱逐良币的过程，但他对鬼畜未来的发展持乐观的态度，“这会是一个螺旋上升的过程”。

　　AI的加入，从某种程度上来说，让鬼畜区变得更加百花齐放了，AI就相当于一个倍增器的存在，人人都可以使用，这也意味着未来一定会有更多的人加入。”

　　李可奕.“鬼畜”流行的文化现象批判分析——以B站鬼畜视频为例.新闻采编，2023，（05）:62-64.

　　昨晚B站社区与产品负责人方方通过其个人账号发文，回应UP主阿test对B站产品的吐槽，并代表B站产品团队向各位UP主和用户道歉。对于此前推出的播放时长指标，方方表示，团队已经决定取消播放时长指标外显的改版，称其过于理想化和自信，没有考虑到外界的接受和理解程度。这原本对B站利好，因为B站上的创作者主要以长视频为主，该决定公布后不少UP主狂喜，甚至开起了香槟庆祝，但目前来看现实情况依然艰难。

　　“别割韭菜了好吗?真拿别人当冤大头啦?”TikTokShop商家小齐没好气地回着消息，准备拉黑给他安利数字人产品的业务员。作为早在2023年初就尝试过数字人直播的“吃螃蟹者”，小齐对自己当时的“头脑灵光”颇为后悔:用数字人录制好的直播材料，刚播了一周，就被平台直接拿下，早期投入血本无归。

　　近日有爆料人在社交平台发帖称，京东金融520活动的测试活动被设置成了全量用户能参与的活动，多人抢到52.1元红包，京东金融损失数百万，内部已经在查。京东金融相关工作人员表示，对于已经获得52.1元立减红包的消费者，不会收回，可放心使用。京东支付用户超过5亿人，微信支付用户超过10亿人，合并超过15亿。

　　快科技6月7日消息，很突然，坐拥500多万粉丝的抖音网红大V小牛说车”突遭封号，目前已经查无此人。从有关注该账号网友提供的照片看，账号封禁原因为由于违反《抖音社区自律公约》的相关规定，该账号已被封禁。”有网友指出，此次被封号，可能和之前的败诉有关。据悉，2023年11月6日蔚来法务部官方微博发文宣布：就抖音账号小牛说车”持有人顾宇波侵犯蔚来名誉权一�

　　Nemotron-4-340B-Reward是由NVIDIA开发的多维奖励模型，用于合成数据生成管道，帮助研究人员和开发者构建自己的大型语言模型（LLMs）。该模型由Nemotron-4-340B-Base模型和一个线性层组成，能够将响应末尾的标记转换为五个标量值，对应于HelpSteer2属性。它支持最多4096个标记的上下文长度，并能够对每个助手轮次的五个属性进行评分。

　　Nemotron-4-340B-Instruct:NVIDIA的高级语言模型，优化于英文对话场景。

　　Nemotron-4-340B-Instruct是由NVIDIA开发的大型语言模型(LLM)，专为英文单轮和多轮对线个token的上下文长度，经过监督式微调(SFT)、直接偏好优化(DPO)和奖励感知偏好优化(RPO)等额外的对齐步骤。模型在约20K人工标注数据的基础上，通过合成数据生成管道合成了超过98%的用于监督微调和偏好微调的数据。这使得模型在人类对话偏好、数学推理、编码和指令遵循方面表现良好，并且能够为多种用例生成高质量的合成数据。

　　WonderWorld是一个创新的3D场景扩展框架，允许用户基于单张输入图片和用户指定的文本探索和塑造虚拟环境。它通过快速高斯体素和引导扩散的深度估计方法，显着减少了计算时间，生成几何一致的扩展，使3D场景的生成时间少于10秒，支持实时用户交互和探索。这为虚拟现实、游戏和创意设计等领域提供了快速生成和导航沉浸式虚拟世界的可能性。

　　HunyuanDiT-v1.1是由腾讯Hunyuan团队开发的一款多分辨率扩散变换模型，它具备精细的中英文理解能力。该模型通过精心设计的变换器结构、文本编码器和位置编码，结合从头开始构建的完整数据管道，实现数据的迭代优化。HunyuanDiT-v1.1能够执行多轮多模态对话，根据上下文生成和细化图像。经过50多名专业人类评估员的全面评估，HunyuanDiT-v1.1在中文到图像生成方面与其他开源模型相比，达到了新的最先进水平。

　　UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间，以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列，支持随机噪声输入和首帧条件输入，显着提高了生成长期视频的能力。此外，它还探索了基于状态空间模型的替代时间建模架构，以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果，并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

　　AI Math Notes 是一个开源的交互式绘图应用程序，允许用户在画布上绘制数学方程。应用程序利用多模态大型语言模型（LLM）计算并显示结果。该应用程序使用Python开发，利用Tkinter库创建图形用户界面，使用PIL进行图像处理。灵感来源于Apple在2024年全球开发者大会（WWDC）上展示的Math Notes。

　　VideoTetris是一个新颖的框架，它实现了文本到视频的生成，特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术，精确地遵循复杂的文本语义，并通过操作和组合去噪网络的空间和时间注意力图来实现。此外，它还引入了一种新的参考帧注意力机制，以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。

　　Visual Sketchpad 是一种为多模态大型语言模型（LLMs）提供视觉草图板和绘图工具的框架。它允许模型在进行规划和推理时，根据自己绘制的视觉工件进行操作。与以往使用文本作为推理步骤的方法不同，Visual Sketchpad 使模型能够使用线条、框、标记等更接近人类绘图方式的元素进行绘图，从而更好地促进推理。此外，它还可以在绘图过程中使用专家视觉模型，例如使用目标检测模型绘制边界框，或使用分割模型绘制掩码，以进一步提高视觉感知和推理能力。

　　EMMA是一个基于最前沿的文本到图像扩散模型ELLA构建的新型图像生成模型，能够接受多模态提示，通过创新的多模态特征连接器设计，有效整合文本和补充模态信息。该模型通过冻结原始T2I扩散模型的所有参数，并仅调整一些额外层，揭示了预训练的T2I扩散模型可以秘密接受多模态提示的有趣特性。EMMA易于适应不同的现有框架，是生成个性化和上下文感知图像甚至视频的灵活有效工具。

上一篇：互联网财产保险保费同比增长8% 下一篇：没有了