admin 发布的文章

AI这块确实很热,尤其是最近几年,AI技术的发展简直是飞速。你看看那些大公司,像Google、Tesla、甚至阿里、百度,他们都把AI当做未来发展的核心。而且你看现在的AI,不仅限于写代码、做数据分析,连艺术、音乐、小说创作都能搞定了。这个“钱”真的是很多。但问题来了,这个“蓝海风口”真的适合所有人去掏金吗?我觉得大家还是要睁开眼睛,别被“风口”迷了眼。咱想想,市场上已经有那么多 AI 大佬和大公司在瓜分这块大蛋糕,咱们普通小白怎么才能找到自己的立足之地呢?《黑客与画家》里说:“那些伟大的作品,往往是在你不被看好的时候开始的。”但想要成为那匹黑马,光靠运气行不通,得有扎实的技术功底和独特的创意

AI 大模型公司,正在疯狂收集训练数据。它们派出无数爬虫,在互联网上无节制地抓取数据。爬虫数量之多、频率之高,堪比 DDoS 攻击。上周,代码托管网站 SourceHut 的站长,公开发表文章(下图),痛斥 AI 爬虫太过份,服务器无法承受访问压力,中断服务。他非常生气,这些爬虫根本不遵守 robots.txt 文件,Git 仓库的每个页面、每个链接、每个提交都要爬取。它们来自全球数万个 IP 地址,用户代理(user-agent 字段)也是随机的,伪装得像真实用户,难以有效拦截。最可气的是,它们今天爬完了,过了六小时,又来爬同样的内容!每一周,他要用20%~100%的工作时间,处理这些爬虫造