• 邮件反馈
  • 支持 TK
  • 微博

    • 看看最新
    • 随便看看
    • 过去一周
    • 过去一年
  • 精选

    • 净想好事
    • 安全合辑
    • 疫苗合辑
    • 读书合辑
  • 文档

    • 搜索说明
    • 百元好物
    • tk猴子

  • 支持
上个页面看看最新
下个页面过去一周

© Copyright 2025. All rights reserved.

加入tk真爱粉群
tombkeeper

2015-08-06 15:53

相比之下,Google 那个女黑客真的非常谦虚。她的内容丰富而精彩,完全可以展开成一个 50 分钟的演讲,但她只申请了 25 分钟。25 分钟全是干货,一句废话没有,真乃会棍届良心。

tombkeeper

2015-08-06 15:45

Blackhat 今年的演讲质量略有提高,能达到二八开,有两成还不错。有些一看标题就能知道价值不大,不过也有看走眼的时候。今天下午就上了一当,那俩哥们太能演了,和国内安全圈的混子不相上下。明明是他们扯了大半年人家也不认这个漏洞,愣能满脸自豪地说成“感谢 XX 和我们一起为此努力了九个月”。

阅读全文 >
阅读全文 >
tombkeeper

2013-10-13 13:12

看到一个Folower的ID,前半部分是一个英文名,后面是“容容容”。我觉得很古怪。点进她的页面,看到照片,然后终于明白,果然需要连用三个“容”。

阅读全文 >
t0mbkeeper

2024-06-08 21:27

有些早一点的电视剧,比如《Two and a Half Men》,一开始只有 720p 的 WEB-DL 或 HDTV 版。字幕组针对这些版本出了字幕。后来又出了 1080p 版,但字幕组没有跟进。

大部分情况下,新出的 1080p 和早先的版本顶多是片头长度不同,只要整体挪一下时间轴就可以匹配。有时候帧率会变化,那也只需要缩放时间轴就可以。但少数情况下,新版本会被重新剪辑。其中绝大多数情况是对原剪辑点插入的黑屏长度进行调整。比如原来两个场景之间有 1.7 秒的黑屏过度,现在改为了 2.4 秒。这种情况通常都需要手工调整时间轴。有些字幕软件提供了通过搜索静音来找到剪辑点的功能,这只能提高定位剪辑点的效率,但仍免不了要手工操作。《Two and a Half Men》就是这种情况。这就是为什么很多字幕组不会为新出的 1080p 版更新字幕,因为成本很高。

虽然此前有些软件试图通过各种原理实现自动时间轴匹配(比如 subsync),但显然效果并不理想,否则字幕组自然就用了。我很早以前就想自己写程序解决这个问题,但感觉投入的时间成本可能要比手工调整的时间还多。

不过现在有大模型帮我写程序了。

我的第一个思路是:720p 的有英文字幕,1080p 的也有英文字幕,那么对比两个英文字幕是不是就能找到时间调整点?然后不就可以根据英文字幕时间轴的变化情况调整中文字幕了吗?

实际开始干之后我发现想简单了。很多剧的早期英文字幕和后来的英文字幕并不只是时间轴不同,断句也不一样。当然这用一些算法可以勉强解决。解决了这个问题后,我又发现一些早期英文字幕存在大量拼写错误。比如 Will 在字幕里是 WiII。这些字幕显然是从 DVD 的 .sub 字幕 OCR 出来的。虽然理论上这可以用一个 OCR 纠错字典来解决,但更糟糕的是很多早期字幕的时间轴本来就不精确,导致很难通过和新字幕的对比来定位调整点。于是这个思路就只能放弃了。

然后我试图模拟字幕软件的“搜索静音”的功能定位剪辑点。程序搞出来之后,我发现找到静音的地方虽然容易,但精确的起始和结束点并不容易定位。因为”静音“是个模糊概念,不同的视频中不太一样。用光线来打比方的话,就是所谓黑暗,也多少还有一点光。你伸手不见五指,猫还能看见。所以搜索静音的标准严格一些,搜索到的静音段就可能偏短,而标准松一些,搜索到的静音段就会偏长。在字幕软件里“搜索静音”并不需要很精确,因为人可以通过看波形和听声音来判断时间轴实际应该调整多少。我又想再模拟人看波形的过程,对新老视频的波形进行比对,找出调整点。但不知是不是因为我不熟悉这个领域,最终实现的效果不太好。速度很慢,准确率也不理想。

然后我就想那是不是可以在搜索到静音片段后再把其中不是黑屏的那部分去掉?因为剪辑插入部分不仅静音,而且黑屏。我试了一下,成功了,终于可以准确找出剪辑插入的部分。

然后我忽然想到一个问题:到底是找黑屏快还是找静音快?如果是找黑屏快的话,那么先找黑屏再判断黑屏是不是静音才是效率最高的。我又试了一下,果然,先找黑屏比先找静音要快好几倍。

现在我只花了很短的时间就有了一个效率很高的能精确找出视频中插入的黑屏静音片段的程序。基于此可以很简单地实现时间轴自动适配。而且我自己没写一行代码,全靠奴役 ChatGPT。

阅读全文 >
tombkeeper

2016-01-27 13:25

我前几年研究 IE 漏洞,查一个内部实现上的特性,结果发现只有 The Tangled Web 这本书里谈了一点。当时还纳闷怎么在一本讲 Web 的书里找到了,然后一看作者是 Michal Zalewski,就不奇怪了。

tombkeeper

2016-01-27 13:09

搞 Web 的应该都知道《The Tangled Web: A Guide to Securing Modern Web Applications》,中文版叫《Web之困:现代Web应用安全指南》。搞二进制的应该都知到 AFL 这个革命性的 Fuzz 工具。而这两样的作者是同一个人。所以搞技术千万别先在心里把自己划到某个派别中去。(但是 Emacs 确实不好用。)

阅读全文 >
阅读全文 >
tombkeeper

2025-04-01 20:18

2005 年查理兹·塞隆主演的电影《Æon Flux》虽然 IMDB 评分只有 5.4,但我还是推荐你们看看。理由很简单,因为是查理兹·塞隆演的。

《Æon Flux》改编自 1991 年开播的同名动画片。那部动画片的口碑很好,IMDB 评分有 7.8。不过用现在的眼光看来,多少会觉得有些诡异。 🔗tombkeeper的微博视频

阅读全文 >
1
...
5356.65357.6
5358.6
5359.65360.6
...
6231