当前速看:俄版百度44.7G源码泄露!遭前员工背刺,涉及搜索地图等主要服务
俄罗斯第一大科技巨头,这回遇上了大麻烦:
(资料图)
44.7GB源代码,全被泄露到了网上。
什么概念?
就是这家名为Yandex的公司,几乎所有主要服务的源代码都被挖了个底掉……
要知道,在俄罗斯,Yandex不仅干着搜索引擎的活儿,还把俄国老百姓购物、打车、订外卖、租车这一连串生活服务都给包圆了。
简单来说,约等于俄版百度+淘宝+美团+滴滴。
这么大个事儿,自然引起了全世界网友的围观。
但就在众人纷纷猜测这又是哪家黑客手笔之际,Yandex的声明却有些令人大跌眼镜:
44.7GB源代码遭泄露,代码被扒了个底朝天
具体来说,泄密链接最早出现在了一个黑客论坛上。
泄密者称,这份44.7GB的Yandex代码库,包含该公司2022年7月以前,除反垃圾邮件规则之外的所有源代码。
这些被泄露出来的代码信息量到底有多大?
看看网友们热火朝天扒出来的细节就知道了……
Yandex不是以搜索引擎起家,常被称作“俄版百度”/“俄版谷歌”嘛,那就先以搜索引擎部分的代码为例。
一位名叫Alex Buraks的老哥就深扒了下Yandex搜索引擎的排名规则,还戏称这对理解谷歌SEO(搜索引擎优化)有很多有用的信息。
毕竟Yandex和谷歌的搜索结果有70%的匹配度,不少人认为其搜索技术用的就是谷歌同款:如PageRank、BERT等。
(掌握了Yandex的规则不就相当于透了谷歌排名算法的家底,手动狗头)
目前已经有大批吃瓜群众来围观,甚至Alex Buraks的这条线程曾在谷歌搜索“yandex”中排名第8。
有趣的是,在Yandex的排名因素中,排在第一个的就是PageRank。
Buraks还直接列出了Yandex的10个排名因素:
当然这还只是其中的一部分,Buraks表示后续还会继续分析。
除了Alex Buraks,也有不少营销大师深扒了Yandex的排名因素,甚至有人都详细整理出了完整的1900+个排名因素。
值得一提的是,在各路大神扒代码的过程中,Yandex搜索引擎的一些“潜规则”也被摆上了台面。
就比如说加拿大黑客Aubrey Cottle就在代码中发现了Yandex是容忍种族歧视的。
还有网友在代码中发现,Yandex的广告投放中,普通广告和色情广告是分开计算的。
官方声明:没有被黑,是前员工泄密
这事儿一出,很快还有一份详细的泄密文件目录被整理出来放在了GitHub上。
作者是一位名叫Arseniy Shestakov的软件工程师。据他评估,这些源代码确实涉及了Yandex的所有主要服务。
包括:
搜索引擎和索引机器人地图服务AI语音助手打车服务广告服务邮件服务存储服务(类似百度网盘)电商服务(类似淘宝)旅游服务云服务还包括在线协同办公、支付、数据分析等等业务。
不过,泄露内容并不包括用户数据等敏感信息。
Arseniy Shestakov总结了几个关键细节:
泄露出来的主要是git存储库里的源代码,不包含git历史记录所有文件日期均可追溯至2022年2月24日大部分软件都没有预先编译好,只有少数例外除了一些例外,没有预先训练好的机器学习模型△Yandex办公楼
事情闹得这么大,Yandex官方也坐不住了,很快发表声明表示:其实我们并没有被黑,是前员工出卖了我们!
Yandex倒是信誓旦旦,但外部的专业人士却有不同看法。
据bleepingcomputer消息,前Yandex技术专家Grigory Bakunov对此事做出了回应。
他认为,这次代码泄露确实不会对用户的隐私或安全构成直接风险,也不会直接威胁到Yandex的专有技术。
不过一些文件仍可能会暴露正在运行的服务,比如说“blacklist.txt”,Bakunov还称:
泄露代码目录:
https://gist.github.com/ArseniyShestakov/53a80e3214601aa20d1075872a1ea989
参考链接:
[1]https://www.bleepingcomputer.com/news/security/yandex-denies-hack-blames-source-code-leak-on-former-employee/
[2]https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
[3]https://twitter.com/Kirtaner/status/1619007274202329091
[4]https://twitter.com/dom_woodman/status/1619028740201398274
[5]https://twitter.com/alex_buraks/status/1618988134850785280
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
关键词: Yandex 搜索引擎 Google 跳槽那些事儿
推荐阅读
流沙河有多长?流沙河流域水电站简介
在西游记中,我们都知道沙僧是从流沙河出现的,那么故事中的流沙河在哪里?流沙河有多长?流沙河流域建了哪些水电站?下面我们来详细了解一下 【详细】
中国第一颗人造卫星是什么 中国第一颗人造卫星简介
中国第一颗人造卫星发射时间等内容介绍:1970年4月24日,在酒泉卫星发射中心成功发射了中国第一颗人造地球卫星东方红一号卫星。这开启了中 【详细】
iOS13正式版推送 iOS13正式版推送值得更新吗?
苹果发布iOS13 5,iOS和iPadOS13 5系统正式版发布,系统新增加了多项功能,用户在安装了正确的开发人员配置文件后可以从Apple开发人员中心 【详细】
虎门大桥怎么样了 虎门大桥没有问题可以恢复通车了吗?
关于虎门大桥已经连续几天成为热门话题了,5月5日,最开始为了保障安全,对交通实行双向封闭。5月10日,组织报告测评,而今天根据官方消息 【详细】
2025年取消燃油车 2025年取消燃油车是真的吗?
相信很多人都听说过中国2025年取消燃油车,接下来小编就带大家介绍一下相关知识,大家可以了解一下。汽车一般使用汽油、柴油等化石燃料作为 【详细】
相关新闻
- 当前速看:俄版百度44.7G源码泄露!遭前员工背刺,涉及搜索地图等主要服务
- 【全球快播报】2亿年前,中国最大化石鲎或曾游嬉陕西榆林古湖中
- 当前关注:2023年我认为最值得读的3本书
- 怎么检测电脑配置 推荐几款可以检测电脑配置的软件
- 第四季度中国手机市场销量情况出炉 iPhone出货居首位
- Alcohol 120%虚拟光驱好用吗 Alcohol 120%虚拟光驱功能使用方法
- 成语笑靥如花含义 成语笑靥如花怎么理解?
- 苹果官网查序列号入口怎么看 苹果官网查序列号入口在哪里?
- ahci模式的开启方式 bios里没有ahci模式怎么解决?
- 网页版QQ登陆流程 网页版QQ登陆的方法步骤
- 电脑ntldr丢失怎么办?电脑ntldr丢失怎么解决?
- 世界消息!用这款无线充电底座,手机变电子时钟?
- 油车换成纯电动车之后发现3个痛点,个个戳心,这一瞬间我后悔了
- 全球速讯:SA:2022年Q3全球中高端和高端智能手机机型获得了可观收益
- 无法进入安全模式咋回事 无法进入安全模式应该怎么办?
- 安全设备作用有什么?网络安全设备简介
- rtx3070显卡好不好 rtx3070和rtx2080ti性能对比评测
- 设置了开机密码后又想要解除密码 解除密码的方法是什么?
- 三星W22 5G配置是什么 三星W22 5G详细评测
- 股票复权的含义是什么 股票复权的意义是什么?