作者:ACFUN_AK

额……老铁们,我图吧老捡垃圾的了。最近咱在很长时间里一直都在摆烂懒得写文章都在发视频了,然后发现最近的视频网站有些也上了YouTube同款的AI自动字幕,这个技术咱记得18年左右当科技区UP的时候就见过了,但是苦于一直没有方法提取下载,而如今咱们找到了B站AI字幕的提取下载方法,简单给各位说明一下。

其实这个方法来自与B站CC字幕的提取套路,最近刚刚成熟出现了在线工具以及大量的视频教程,之前我们在年前想要搞的时候还是没有的。

总之我们的需求就是当时出的一些杂谈视频有评论反馈说咱用的耳麦录音效果差听不太清,然后咱感觉还是有点重要的所以需要想办法弄了字幕。

弹幕倒是只有UP可以查到来源但是咱一看明显是龙芯圈那种贴吧段位的开团咱直接选择理都不理。但是当时录这期节目的时候咱可能确实还没太认真所以也没选择什么好麦不像最近谈低温锡的时候选用的是罗技的H110,而是家里祖传的掉皮耳机,那效果不好就可想而知了。

但是其实咱们发现这个视频的观看是可以选择AI字幕的,虽然很多时候冷门词语或者发音不准确的时候识别效果非常的感人但是至少它是现成的可以改的字幕,然而当时咱看了半天结果发现并没有什么办法能直接下载这个字幕,行吧。

结果最近出现了转机,就像咱刚才说的一样,B站出现了做CC字幕提取的UP然后他们的提供的方法经过简单改进就可以提取AI字幕,对于咱这种做视频也好写文章也好想到哪说哪根本不打草稿的老UP非常方便。咱现在就是面临这种情况因为做视频怎么方便怎么来根本就没有工程文件视频一删本地连个档都没有,就导致如果回头需要引用自己视频的文案还得手动提取AI识别字幕,属于是非常麻烦的一个问题。现在这个需求也能解决

简单来说提取B站AI字幕的方法就是开F12然后直接关闭播放器字幕点刷新或者F5,然后在开发者工具里面选Network然后从Filter搜索框里面输入关键词就可以找到JSON格式的CC字幕

这个链接带subtitle的就是

然后这个链接直接打开就能看见JSON格式的字幕,可以双击也可以复制链接再开怎么都一样

至于AI字幕只需要把关键词换成ai_subtitle就可以了

然后说下这个问题,简单来说这样的JSON字幕咱是没法直接拿来就用的,因为正常的非编软件也好字幕软件也好都是认传统的ASS SSA SRT甚至LRC之类的字幕的,它们不认这种JSON格式的字幕

但是之前咱说什么来着,最近搞CC字幕的UP才刚开始把这套工艺成熟化,当时咱发那个杂谈视频的时候是还没有出现转换工具的,而现在随便把JSON字幕链接页面上的内容Ctrl+A全选之后再Ctrl+C+V就可以导入到在线工具里转换了,连下载.JSON文件都不需要

这里我们可以看到无论是AI生成的JSON字幕还是上传的CC字幕都可以直接转成标准播放器和非编软件支持的格式,如果你下载了.JSON文件还可以直接上传。

选择TXT格式的话还可以出不带时间轴的纯文字,然后选择保存到本地就可以直接用记事本打开了

SRT格式导入播放器也能直接以外挂字幕的形式存在,更改字体什么的也很容易就能做到,如果想转内嵌字幕简单修改一下AI字幕中识别错误的部分再保存然后就可以直接导入非编或者压制工具用软件压制了

这个校对的活可以直接用记事本干也可以开其他字幕软件之类的

这里我们需要说明的是经过实践发现B站AI生成字幕提取转换之后尝试导入AEGIS或者小丸工具箱之类的可能会出现打不开报错卡BUG,比如时间轴上有零时长的片段或者语法错误之类的,但是这种问题的解决方法也比较简单

可以先把AI生成转换出来的字幕投稿到视频

然后通过之后再提取下来的字幕转出来就基本没什么问题了,可以直接塞进小丸工具箱之类的进行压制,就不会再卡BUG了(然而AEGIS还是报错)

然后用小丸工具箱压制的话是可以直接做内嵌字幕在里面的,但是经过实测我们发现10多分钟的1080P视频也得压个至少10分钟以上,效率比较低,而且这期间还存在没标注字体的字幕只使用默认字体的情况。

所以咱还有一种解决方案做字幕也好文字转语音也罢比较简单粗暴就直接开录屏就行了,现代GPU普遍集成视频编码器可以实现硬件编码视频,它用来录屏的效果其实画质损耗相比用CPU压制不算特别大属于可以接受的水平,除非你在做画质展示不然这种杂谈类的肯定是没问题。

简单来说咱就是用这种方法给之前在年前的杂谈视频做出来了内嵌字幕视频+外挂字幕更新顺带捎带手的还提供了纯文字版:

然后咱们自己这边其实就已经完活了,这期教程可以完事了。但是咱本着好奇的心理尝试对隔壁UP也进行了AI字幕的提取,结果发现居然也能提出来:

这距离视频转文章只有一步之遥了,虽然这个视频UP做了内嵌字幕然后也压根不知道AI字幕的存在甚至还得是咱提醒之后才想起去关但是现在这个情况就比较危了,过去我们常说文字转语音普及之后给了大量营销号洗稿的机会,一两个人上网到处扒文章出视频就能维护好几个营销号了,过去咱甚至还参加过AB站的营销号战争,当然最后的结局是战败咱就不提了,反正现在B站的所谓激励计划已经名存实亡了之前咱也预见并退了,这年景压根没法靠做视频养活人。

时过境迁现在B站都在鼓励文章一键转视频了,真是人均营销号

咱相比隔壁UP的处境其实好很多,当年营销号战争的时候咱心态好做视频写文章从来不强求有多火要多少曝光自己涨粉多快虽然咱也能高产但是咱不整那些没用的所以最后能甘于平凡没有选择自取灭亡。最近发现龙芯圈大举进攻兆芯和其他国产芯片需要测游戏体验为国产正名的时候正好国产采集卡MS2130大量铺货,录制效果相当不错性价比直接起飞,需要把过去脱稿直接录的视频转文字就可以直接扒AI字幕,属于是想睡觉就来枕头。但是对于一般人来说这个技术的普及可就没那么妙了。

过去我们需要做语音转文字做识别字幕需要开ARCTIMEPRO然后每天签到或者买会员才能实现普通视频长度的语音自动识别的(前作:全自动语音识别生成字幕打轴软件ARCTIME使用简介),因为这玩意的语音识别应该是在线识别,并不是离线本机就能做到的。

现在我们这套操作完全不需要任何成本,相当于把语音转文字的算力需求托管给了视频平台。然后所有用户都能下载和使用,属于无CD无限蓝的技能了,这东西的扩散势必引发新一轮的洗牌。就像AI画画一样,未来这种技术大范围扩展的直接结果可能导致的后果就是卷死低端重复劳动只能留下精英配合AI操作,成为AI操作工+技师,未来很多搬运油管视频的字幕组可能会和画师一样选择使用AI识别+人工校对修正的方法制作字幕,节省下大量的手工打轴和听译时间和人工成本。这也是我们比较期待的一个未来,所有汉化组都不需要耗费大量的时间去进行简单重复操作直接交给软件或者说AI,只留下一些对人的智能要求比较高的工序使用人工就可以实现整个流程。未来收费汉化绝对会被卷死的,收费字幕组也大差不差,只有一些情况会比较常见就是用AI生成以次充好相当于卖高级机翻汉化,和现在的画师嘴上喊着反对AI实际上商业稿件使用AI最为积极是一个道理,面对实际需求和利益相关的时候人往往是比较现实的。总之对于个人UP来说保护好自己的知识产权的时候到了,不要被人用AI当成数据库或者洗稿来源就好。

总之这个技术的风险咱已经提醒隔壁的UP了,希望他们没事或者至少心态还好。

目前来看这套操作对于B站不生成AI字幕的视频无效

当年和快视频一起脱库B站的西瓜视频如今活得害挺不错,自从巫师财经之后也算是慢慢成为主流平台了,相当于抖音的长视频平台。它们对AI字幕的生成门槛就比较高反正咱自己的视频需要AI字幕的看了下一个没有,估计还在内测阶段没有大范围实用,用B站的关键词在F12里面搜索也没找到能直接用的JSON字幕,估计用的是别的方案。所以目前这个教程主要还是对B站有效,西瓜视频还有待进一步的观察估计未来被抓字幕也只是时间问题毕竟只要能提供理论上就能抓。所以各位创作者还是得尽量保护好自己。

目前好像咱知道的有AI字幕开放的就这两家,AcFun现在是一步错步步错一步慢步步慢,估计快手也早已没有进军长视频的信心了。现在回头看A站真是2018年什么样现在还什么样,就是人越来越少了。所以说咱是衷心感谢对面在知道自己不行了之后先用无故封咱所有账号删稿的方法得罪了咱让咱离开的时候心里没有一点愧疚,不然其实咱很多时候可能会和隔壁的一些UP一样死守在那然后最后实在是混不下去再回B站这就很难受了。

就这样,谢谢朋友们!