代码依赖症:算法时代的是与非

算法的目的在于优化一切。它们可以拯救生命,使事情化难为易,化繁为简。但专家们仍担心它们会被公司和政府过度使用,用以维持偏见,创造过滤泡泡,削减选择、创造力和意外的发现,并可能导致更严重的失业。

算法是用于解决问题或完成任务的指令。食谱即算法,数学方程式亦是算法。计算机代码同样是算法。互联网基于算法运行,所有在线搜索同样通过算法完成。算法告知电子邮件发去哪里。智能手机应用也不过是算法。计算机和视频游戏也是关于算法的故事。没有算法,在线约会、书籍推荐和旅行网站将无法运行。GPS定位系统通过算法告知人们如何从A点到达B点。人工智能(AI)虽然调皮,也是一种算法。人们在社交媒体上看到的东西通过算法得以展示。事实上,人们在网络上所看所做的一切都是算法的产物。人们在电子表格中对列进行排序时,算法也起了作用,而且当今大多数金融交易都是通过算法完成。算法帮助小工具响应语音命令,识别面部,排序照片,创造和驾驶汽车。黑客、网络攻击和加密、解码均利用算法。自我学习和自编程算法现在正在出现,所以未来很多的算法本身可能将由算法去写。

作为一种优雅且极其有用的工具,算法常常用于完成任务。他们经常扮演着隐形的角色,以不可思议的方式融入人们的生活。然而,有时创意良好的算法应用仍会导致意想不到的后果。最近的新闻涉及这些问题:

英镑在2016年10月7日几秒之内暴跌6.1%,部分是因为算法触发的货币交易。

微软的工程师去年春天创建了一个名为“Tay”的Twitter机器人,试图通过回应提示与千禧一代进行聊天,但仅仅几小时,它便口不择言,喷出种族主义,性别歧视,否认大屠杀的推文,只因基于算法,它是先“学习”别人发给它的推,再来响应别人。

Facebook试图创建一个功能,用以从网站上所有人的信息流中突出热门主题。以前,是由人工团队进行编辑,但争议很快便爆发,因有人指责该平台对保守派存在偏见。所以Facebook将工作交由算法完成,却发现算法根本无法辨别真假新闻。

Weapons of Math Destruction的作者Cathy O’Neil指出:大数据在增加不平等和威胁民主的同时,基于算法的预测分析更倾向于惩罚穷人,就以使用算法招聘作为一例。

善意的算法可能被恶意的使用者玩坏。2016年10月21日,黑客通过信息过载电路轰炸了互联网流量处理程序Dyn DNS,互联网减速迅速席卷美国东海岸,从此开启了通过网络连接设备进行网络攻击的新时代。随后互联网安全专家Bruce Schneier在9月警告说,“有人在学习如何搞垮互联网。”随着2016年美国总统选举的进行,Facebook新闻信息流算法的滥用和常见假新闻的公布已引起争议。

研究员Andrew Tutt呼吁“算法的FDA”,他指出:“越来越复杂的算法的兴起需要我们慎重考虑如何最佳地预防、阻止和补偿它们造成的危害。算法规则需联邦统一、专家判断、政治独立和市场预调查,用以阻止——当然并不扼杀创新——高危算法被引入市场。

白宫于2016年10月发布的两份报告详细介绍了算法和人工智能的发展以及解决与之相关的问题的计划,并发布了一份12月报告,概述了人工智能驱动的自动化对美国就业市场和经济的潜在影响。

2017年1月17日,未来生命研究院(Future of Life Institute)发布了一份由加利福尼亚州太平洋格罗夫市Asimolar会议相关研究人员创建的23项有益人工智能原则的清单。签约者超过1,600个,包括史蒂芬·霍金、Elon Musk、Ray Kurzweil和数百名世界顶级人工智能研究员。

随着大量数据被企业和政府创建、捕获和分析,算法的使用正在蔓延。有人将此称之为算法时代,并预测算法的未来与机器学习和深度学习有关,而且它会被极速地优化。

2016年美国总统选举的众多事后分析记录了基于网络的工具对选举结果的革命性影响,但XPrize基金会的首席执行官Peter Diamandis预测:“五大技术趋势使这次选举看起来极其乏味。”他说,量子计算的优势和人工智能以及互联网系统、设备内置的人工智能嵌入的迅速进化将导致对选民的超级跟踪、影响和塑造,还有超级个性化的广告,将创造新的方式来歪曲现实并维持假象。

关于算法时代的7大主题:

主题1:算法将继续到处蔓延
益处将是可见和不可见的,并致使人类更大范围地洞察世界;
算法的许多方面都伴随着挑战。

主题2:好的前景
数据驱动解决问题的方法将会扩散;
代码流程将被完善和改进,伦理问题亟待解决;
算法不必完美,只是它们比人做得更好;
在未来,世界可能由仁慈的AI(人工智能)治理。

主题3:当数据和预测建模变得至关重要时,人类将迷失,人类的判断力将丧失
以追求利润和效率为主要目的的编程将是一个威胁;
算法操纵人和结果,甚至会读我们的心;
所有这一切都将造成一个不可避免的有缺陷的逻辑驱动的社会;
有些人担心会失去复杂的决策能力和局部智能;
随着代码接管复杂的系统,人类被遗弃在循环之外;
解决方案应该嵌入对个体的尊重。

主题4:偏差存在于算法组织的系统中
算法反映了程序员和数据集的偏差;
算法取决于数据,所以常常有限、不足且不正确。

主题5:算法分类加深了分裂
缺点可能更是如此;
算法创建由公司数据收集器塑造的过滤器泡泡和筒仓。他们限制人们接触更广泛的想法和可靠的信息,并且消除偶然性。

主题6:失业率将上升
更智能,更高效的算法将取代许多人工劳动;
一些人寻求重新定义全球经济体系来支撑人类。

主题7:需要增加算法扫盲、透明度和监督
它开始于算法扫盲——这超出了基本的数字化扫盲;
人们呼吁问责过程、监督和透明度;
许多人对政策规则和监督的前景表示悲观。


翻译:Nansey 来源:Pew Research Center

不能说的秘密

大概是在2014年,有网友在豆瓣写过一篇短时间内流传甚广的文章,叫《慢慢的,就没有了,就像从未存在过》,之所有说短时间内是因为,到最后连那篇文章本身,也一夜之间从豆瓣消失了,真的就像从未存在过一样。这是讽刺,也是现实。

那篇文章列举的例子里,Google于2010年3月被封,Facebook于2009年7月被封,Twitter于2009年6月被封,Youtube于2009年3月被封,Instagram于2014年9月被封。因为各种冠冕堂皇或是莫名其妙的原因。

查看Alexa sites列表,全球Top10sites已经6个上不去了,Top30sites里有接近一半无法访问。而据GreatFire.org监测,Alexa Top1000 domains有160个, 53273domains里有6012个在中国均被屏蔽。微博搜索30131个测试关键词有3181个遭到审查。甚至http的安全版https协议测试24527个也有5977个遭遇屏蔽。

我已经完全不想再去引用Wikipedia里Internet censorship in China的数据和报道,因为事情发展到后来,维基百科里早已出现了Self-censorship的页面。这是一种悲哀,哀莫大于心死。

我也完全不敢去想象这样的场景,去和00后的小妹妹小弟弟们谈论这些全球最优秀的网站。因为于她们而言,这些就像从未存在过的事物一样。历史发展的趋势是一样的,想想长辈们从前和我们讲述某一段敏感的历史,我们也曾觉得不可思议。如今的中国就象是魔幻的现实。

再说最近,2016年5月底,在北京召开的两院(中国科学院和中国工程院)院士大会上,不少院士抱怨网络封锁不仅对科研人员不利,对科学发展不利,也对国家形象不利。而最新的新闻是中国最高立法机构全国人大常委会11月7日通过了颇具争议的网络安全法,全球40企业团体致函反对。再近一些的乌镇互联网大会上,中国官方通过提供专用无线网络,供嘉宾、记者使用Facebook、Twitter、美国之音、德国之声、自由亚洲电台、BBC中文网等被防火长城封锁的网站。网友戏称,互联网大会应该改名局域网大会才对。

记得前几年在微博上流行的是“围观改变中国”、“批评官员的尺度”与“若批评不自由,则赞美无意义”,现在恐怕知道“敏感瓷”和“河蟹”的网友只会越来越少。有谁还会记得那年的李承鹏、方舟子还有陈光诚呢。感伤的怀旧的同时其实是历史的健忘。

更不会有人关心或是知道,总部设在美国的《自由之家》发表的2015年度全球网络自由度报告中,中国在65个受调查的国家中位居榜末。

我向来不明白,一个怀揣着中华民族伟大复兴的中国梦,武装着“马列毛邓三”等重要思想,有着Globalfirepower上排名第三的军力,现在又有了新的党的领导核心的泱泱大国,为何在网络上这般羸弱而不自信。我也不能够理解,不准人民使用的Twitter上官方媒体如新华社和人民日报为什么还要去开设账号。

对于这些问题,大多数人似乎根本无所谓。没有了Google,他们有百度;没有了Facebook,他们曾经有人人网,现在有朋友圈;没有了Twitter,他们有微博;没有了Youtube,他们有优酷;没有了Instagram;他们有美颜相机。每天刷刷娱乐转转鸡汤似乎也挺快乐。

这是哀其不幸,怒其不争。一百年了,人们还是那群围观给俄国人做侦探被日本军捕获的同胞最终要被枪毙时呼喊“万岁”的麻木的中国人。

新闻、事实和真相何其廉价。人们早已习惯了墙内社交网站上那些断章取义、添油加醋的转载、翻译、截屏、还有造谣,习惯了这样一种粪便般的信息环境。那时都说“外事问谷歌,内事问百度”,现在他们根本不问了。信息能否流通,资源能否共享,人们根本不关心。他们现在关心的是创业和自媒体。微博江河日下以后,朋友圈似乎扮演了更重要的角色。

但是很少人意识到,从诞生的那一天起,微信便是一种孤岛化的存在,朋友圈也好,公众号也好,这是一个封闭的空间。我们看到了几乎所有的传统媒体在这个平台上开通了他们的账号,但是腾讯却从不希望自己变成一个公共媒体平台,因为那意味着更大的审查压力和运营风险。

而据腾讯发布的Q3业绩报告,微信与WeChat月活跃用户数已经达到了8.46亿。公众号数量据说目前也到了2000万。巨大的用户数后面是巨大的流量和内容生产。但是除了微信本身和搜狗鸡肋的搜索,所有这些内容依然是在微信系统内部消解,犹如局域网内部的局域网。与当初半开放的微博相比,微信里的信息现在甚至连独立永久的URL都没有。内容之间无法连接,跨平台之间难以分享,这简直就是开放的互联网之外的一个怪胎。

不过,这倒是政府喜闻乐见的一种形式,因为中文互联网正在变得听话而无趣。

最后,转一句网友的评论作为这篇文章的结尾吧:

“我怒吼一句,身边的大多数人却像看疯子一样地看着我。我哀嚎一声,这声音被阻碍在黑黑的幕墙以里。我发出尖锐的嘶吼,这声音传不了多远,就和我那被抢走的东西一样,消失了,不见了,就像从来没存在过一样。”