周四晚饭聚餐,拍摄到的落日余辉。工作太忙,好久没好好看风景了。
2025年第16周,总第007期。
拾光记:记点闲事,网海闲游,随心所想,任意徜徉。
1. 时光
终于完成项目,看了一下 readwise,发现从 3 月 21 号之后就没怎么阅读了。一口气阅读完了,比日常阅读粗略很多。
1.1. 阅读
秦本纪第五,读到秦穆公时期。岐下野人。
1.2. 觉知
长河落日。文化水平不足,一头扎在工作中 N 久后,难得忙完放松身心,聚餐时看到江面上落日余晖、沙船缓缓划过,心中却只想到“大漠孤烟直,长河落日圆”这句话,好在终于有闲暇看风景了,不然然工作再忙又有什么意义。
1.3. 技术
家里 4070s 的台式机自从装配后一直吃灰,现在 50 系显卡都出来了,好亏。
最近看到一个项目 PDF Craft。据称可将 PDF 一页一页读出,并使用 DocLayout-YOLO ,将书页中的正文提取出来,并过滤掉页眉、页脚、脚注、页码等元素。书页会使用 OnnxOCR 进行文本识别。并使用 layoutreader 来确定符合人类习惯的阅读顺序。仅靠这些可在本地执行的 AI 模型(使用本地显卡设备来加速),便可将 PDF 文件转化为 Markdown 格式。还可以解析书籍(一般页数超过 100 页),将其转化为 EPUB 格式的文件,转化过程中会将本地 OCR 识别出的数据传给 LLM,并通过特定信息(比如目录等)来构建书本的结构,最终生成带目录,分章节的 EPUB 文件。这个解析和构建的过程中,会通过 LLM 读取每页的注释和引用信息,然后在 EPUB 文件中以新的格式呈现。此外 LLM 还能在一定程度上校正 OCR 的错误,需要配置 LLM 服务,推荐 DeepSeek。
如果利用该项目转化一些书籍倒是不错。
1.4. 运动
连续 9 周运动勋章。
1.5. 音乐
黄昏。借用一个听友的评论:不是老歌突然变好听了,是你有故事了。
1.6. 影视
阿里云盘里的影视有一个多月没有看过了,1t 的观看流量不知道怎么用。工作压力较大,刷了很多陈翔六点半的搞笑节目解压,凡人和牧神记没啥好说的,一直在追。无意中刷到个国产剧 机械画皮,评分很差,发现边看边骂无脑剧有时候真解压。
1.7. 育儿
带小孩去吃野菜,可惜做法偏辣,只能自己吃咯。
1.8. 平常
节奏终于慢下来了,可以多些业余活动。
2. 摘录
2.1. 博客
以下内容摘录自科技爱好者、山边远志等博客 rss 订阅。
- AI 与生活: 我们这一代人正在面对 AI 革命的挑战,就如同上一代人面对个人电脑的崛起一样。不论 AI 被视为利好或挑战,我们都无法避开它对工作效率和创作方式的影响。
- 书法江湖体: 一切艺术作品,能做到平淡天真,需要下很大一番功夫,是一种对自己的彻底坦诚。
- 真实道歉: 道歉 (Sorry 或者 apologize)应该用在确实需要承担责任的场合。在其他情况下,我们可以选择更积极的表达方式,如感谢、建议或说明。这不仅能让沟通更加顺畅,也能营造更加正面的互动氛围。我们保持礼貌的同时不需要过度谦卑,真诚的表达和尊重即可。
- 生活两条路: 学西方技术,改善外在条件;想内心安宁?东方智慧得花时间参悟。
- 阻止 AI 爬虫: 最简单的方法,就是使用 Cloudflare 公司的免费防护,它的 CDN 可以帮你挡掉 AI 爬虫。如果有些服务不适合使用 Cloudflare,可以使用 Anubis,它是一个采用工作量证明的反向代理,用户访问网站时,首先看到不是目标网站,而是 Anubis 的页面,这个页面会在用户的浏览器上,执行一段 JS 程序,进行大量的数学计算,对于爬虫来说,如果每个请求都要耗费大量计算,才能拿到数据,这会极大地消耗它的服务器资源,从而达到阻止爬虫访问的目的。
- 组合 Web 应用: 在 2025 年开发 Web 应用,有点像组装宜家家具。你必须拼凑和配置许多单独的服务:前端、后端、cdn、https、数据库、身份验证、付款…… 你的工作不是写代码,而是配置、管道、编排、工作流、最佳实践。
- 超越愤怒: 愤怒是一种具有破坏性的情绪,会让人产生报复的欲望,这不利于你的根本利益。更理性的方法是,不要先想到报复,而要想想你与对方有没有共同利益,寻求合作和谅解。 – 《超越愤怒》
- 因对而异: 各种宗教都驱逐异教徒,不是因为他可能是错的,而是因为他可能是对的。-- Edsger W. Dijkstra
- 复活古生物: 美国基因工程公司 Colossal 宣布,复活了一万年前灭绝的 恐狼。他们从化石提取了恐狼的 DNA,然后以其为样本,对现存最接近的动物灰狼进行基因编辑,才诞生出恐狼。 恐狼与灰狼的最大区别是,前者的体型要比后者大 50%。
- 直接跳转: QuickGo 很多网站会将外链导向一个中间页面,从那里跳转打开。这个开源的 Chrome 浏览器插件,可以省掉这个步骤,自动打开目标页面,支持自定义规则。
- 使用 AI: 用户对 AI 越有信心,就越不会进行独立思考。反过来,用户越不信任 AI,就越可能质疑结果,验证信息,并深入思考。用户并不懒惰,很多人都是经验丰富的专业人士。但当工具快速、自信、清晰地给出结果时,他们就会出于惰性,放弃困难的部分,不再质疑,不再核实,全盘接受。 – 《AI 导致批判性思维逐渐崩溃》
- 耐心: 只有那些有耐心做好简单事情的人,才能获得轻松完成困难事情的技能。 ---- 席勒,德国诗人。
- 依靠技术: 科幻电视剧《黑镜》完全是技术悲观主义,只谈技术的风险,不谈技术变革让现在的生活比过去好。它传播对未来的恐惧,让人们惧怕技术变革。 但是,如果我们想要更美好的未来,就只有依靠技术。 – 英国《卫报》
- 真实创作: 现在的社交媒体,不看重优质内容,而看重互动,看重通过货币化和 AI 吸引更多的流量。这导致用户会被欺骗,会被诱导产生情绪波动,而看不到真正的创作和真实性。 – 《没有人应该成为"内容创造者"》
2.2. Hack News
- 泄露的战争计划: 2023 年 10 月,哈马斯入侵以色列南部后,胡塞叛军发动了对以色列和国际航运的攻击,造成全球贸易混乱。2024 年,拜登政府未能有效应对这些攻击,特朗普政府承诺采取更强硬的措施。2025 年 3 月 15 日,美国对也门的胡塞叛军目标发动了袭击,世界各地的人们都知道了这一消息。但是,作者杰弗里·戈德伯格在袭击发生前两个小时就知道了这一计划,因为国防部长皮特·赫格塞斯不小心将战争计划发到了包括作者在内的群聊中。
- 洗碗机的物联网功能: 新的博世(Bosch)洗碗机的一些功能,如延迟启动和节能模式,只能通过一个叫做 Home Connect 的应用程序来访问,而这个应用程序需要连接到互联网。有人对此感到不满,因为这些功能应该可以直接通过洗碗机的控制面板来访问,而不需要依赖于应用程序和互联网连接。认为这是一个设计上的缺陷,可能是为了让用户购买更贵的型号或者依赖于互联网服务。
- 社区交流: 密集的城市环境可能会因为社交规范和文化背景而导致人们避免眼神接触和交流。
- CVE 基金会: CVE 计划作为全球网络安全基础设施的关键组成部分,已经运营了 25 年。然而,其作为美国政府资助的项目运营,引发了人们对其可持续性和中立性的担忧。CVE 计划的终止被认为是 “悲剧性的”,许多网络安全和 CVE 专家对此表示遗憾。Sasha Romanosky,兰德公司的高级政策研究员,认为 CVE 计划的终止将使软件漏洞生态系统失去基础。CVE 基金会正式成立,旨在确保通用漏洞和暴露(CVE)计划的长期可持续性、稳定性和独立性。
- Apache ECharts: 是一个开源的 JavaScript 可视化库,提供了多种图表类型和组件,可以任意组合使用。该库具有强大的渲染引擎,支持 Canvas 和 SVG 渲染,能够实时渲染大量数据。同时,ECharts 还提供了专业的数据分析功能,支持数据转换、过滤、聚类和回归分析等。
- 基本收入: 基本收入并不会使人变得懒惰,反而可以促进个人自主决策,尤其是在某些人群中。同时,基本收入也对参与者的满意度和心理健康产生了积极影响。研究还发现,基本收入可以帮助个人满足物质需求,并促进财富的积累,但参与者并不仅仅将这些资金用于个人消费。此外,研究项目还探讨了基本收入对个人自主性、幸福感、财务状况以及意外效果等方面的影响。研究结果显示,基本收入可以增强个人独立性,提高自主决策能力,并对心理健康产生积极影响。同时,基本收入也可以帮助个人实现财务稳定,并促进社会的整体发展。
- 效率安全: 马斯克的政府效率部,DOGE 团队要求 NLRB 不记录他们的活动,并且在访问系统后尝试删除记录,这种行为被多位网络安全专家比喻为黑客行为。举报人还表示,NLRB 的 IT 部门发现了来自俄罗斯的可疑登录尝试,这使得他们更加担心数据泄露的可能性。
2.3. 评论
- 记事本(Notepad)和画板(Paint),一直是 Windows 的基本组件,每一代 Windows 都内置了,免费使用。但是,Windows 11 最新一次的更新,为这两个软件加入了 ai 有关的收费功能。
微软都 50 周年了,你还知道多少 50 年以上的公司
3. 随想
十年: 3 月份就有个想法在现在博客里开个新专题,专门记录 10 年之前的重要社会民生和热点新闻,追踪现在的情况,因为我觉得互联网很健忘,我自己也很健忘,想通过回忆来认识自己,但是感觉一个人做不来,还没有付诸行动。