131-1198-7613
NEWS
网站建设、网站制作、网站设计等相关资讯

必应辞书和微软翻译_微软必应辞书在线翻译(必应词典和微软翻译)

首页 >> 新闻资讯 作者:磁力SEO 来源:磁力SEO - 搜索引擎优化技巧 日期:2025-02-18

  新媒体管家

题图:《浪潮之巅》作者、元丰资源创始人

腾讯原副总裁、Google资深研究员 吴军博士

  打定机在打点各种智能标题上的前进幅度并不大,可是十几年量的积累,最终促成了质变。

泉源: 吴军公开采访、互联网公开资料

如需转载请留言配景,违者必究!

1

这个时代属于大数据

简朴地讲,其时无论是做语音识别、机器翻译、图像识别,照旧自然语言大白的学者,分成了界限很大白的两派,一派坚持采纳传统的人工智能方法打点标题,简朴来讲就是模拟人,另一派在倡导数据驱动方法。这两派在不同的领域力气不一样,在语音识别和自然语言大白领域,倡导数据驱动的派比较快地占了优势;而在图像识别和机器翻译方面,在较长时间里,数据驱动这一派处于下风。

这里面紧张的缘故因由是,在图像识别和机器翻译领域,过去的数据量很是少,而这种数据的积累很是坚苦。图像识别就不用讲了,在互联网呈现之前,没有一个实施室有上百万张图片。在机器翻译领域,所须要的数据除了日常的文本数据,还须要大量的双语(以致是多语种)对照的数据,而在互联网呈现之前,除了《圣经》和少量团结国文件,再也找不到类似的数据了。

在20世纪90年月互联网兴起之后,数据的获取变得很是等闲。从1994年到2004年的10年里,语音识别的错误率镌汰了一半,而机器翻译的正确性前进了一倍,其中20%左右的贡献来自方法的改进,80%则来自数据量的抬举。当然在每一年,打定机在打点各种智能标题上的前进幅度并不大,可是十几年量的积累,最终促成了质变。

数据驱动方法从20世纪70年月最先起步,在八九十年月获得痴钝但稳步的成长。进入21世纪后,因为互联网的呈现,使得可用的数据量剧增,数据驱动方法的优势越来越显着,最终完成了从量变到质变的飞跃。如今许多须要类似人类智能才气做的事情,打定机已经可以胜任了,这得益于数据量的增加。

全全国各个领域数据不绝向外扩展,逐渐形成了此外一个特点,那就是许多数据最先呈现交错,各个维度的数据从点和线逐渐连成了网,或许说,数据之间的关联性极大地增强,在这样的背景下,就呈现了大数据。

2

智能手机和互联网将担当改变全国

大数据的时效性着实不是必需的,可是有了时效性可以做到许多过去做不到的事情,城市的智能交通治理便是一个例子。在智能手机和智能汽车(特斯拉等)呈现之前,全国上的许多大都会当然都有交通治理(或许节制)中间,可是它们能够获得的交通路况信息最快也有20分钟滞后。如果没有能够跟踪富足多的人出行情况的实时信息的工具,一个城市即使陈设再多的采样调查点,再频繁地报告各种交通事故和拥堵的情况,集体交通路况信息的实时性也不会比2007年有多大改进。

可是,在能够定位的智能手机呈现后,这种情况获得了底子的改变。因为智能手机富足普及并且大部门用户开放了他们的实时位置信息(合适大数据的完整性),使得做地图办事的公司,好比Google或许百度,有或许实时地获得任何一个人口密度较大的城市的人员运动信息,并且凭据其运动的速度和所在的位置,很等闲区分步行的人群和行进的汽车。

因为收集信息的公司和提供地图办事的公司是一家,因此从数据采集、数据处置惩罚处罚,到信息发布中间的延时微乎其微,所提供的交通路况信息要实时得多。操纵过Google地图办事或许百度地图办事的人,对比六七年前,都很显着地感到了其中的不同。当然,更实时的信息可以通太过析历史数据来推测。一些科研小组和公司的研发部门,已经最先操纵一个城市交通状况的历史数据,团结实时数据,推测一段时间以内(好比一个小时)该城市各条蹊径或许呈现的交通状况,并且资助出行者规划最好的出行蹊径。

过细推敲英语中bigdata这种说法,我们不得不认可这个提法很是正确,它最重要的是传达了一种信息——大数据是一种脑筋方式的改变。如今的数据量比拟过去大了许多,量变带来了质变,脑筋方式、服务变的方法就应该和以往有所不同。这着实是资助我们大白大数据概念的一把钥匙。在有大数据之前,打定机并不擅长打点须要人类智能来打点的标题,可是今日这些标题换个思路就可以打点了,其焦点就是变智能标题为数据标题。由此,全全国最先了新的一轮技术革命——智能革命。

3

大数据更是一种脑筋方式革命

在方法论的层面,大数据是一种全新的脑筋方式。按照大数据的脑筋方式,我们服务变的方式与方法须要从底子上改变。

要说清晰大数据脑筋的重要性,须要先回首一下自17世纪以来不断指导我们曰常服务行为的先前最重要的一种脑筋方式一一呆板脑筋。今日说起呆板脑筋,许多人连忙想到的是死板、僵化,觉得很是落后,以致「呆板」自己都算不上什么好词。可是在两个世纪之前,这可是一个时髦的词,就犹如今日我们说互联网脑筋、大数据脑筋很时髦一样。可以毫不夸张地汫,在过去的三个多世纪里,呆板脑筋可以算得上是人类总结出的最重要的脑筋方式,也是今世文明的根本。今日,许多人的行为方式和脑筋方式着实依然没有解脱呆板脑筋,尽管他们嘴上谈论的是更时髦的概念。

那么,呆板脑筋是奈何产生的?为什么它的影响力能够延伸至今,它和我们将要接头的大数据脑筋又有什么关联和本质区别呢?

必应词典和微软翻译_微软必应词典在线翻译 必应辞书和微软翻译_微软必应辞书在线翻译(必应词典和微软翻译) 必应词库

不论经济学家照旧之前的托勒密、牛顿等人,他们都依照着呆板脑筋。如果我们把他们的方法论做一个简朴的概括,其焦点脑筋有如下两点:首先,须要有一个简朴的元模型,这个模型或许是假设出来的,然后再用这个元模型构建复杂的模型;其次,整个模型要和历史数据合适合。这在今日动态规划治理学上还被普遍地操纵,其焦点脑筋和托勒密的方法论是平等的。

后来人们将牛顿的方法论概括为呆板脑筋,其焦点脑筋可以概括成这样几句话:

第一,全国厘革的纪律是确定的,这一点从托勒密到牛顿大家都认可。

第二,因为有确定性做保障,因此纪律不单是可以被熟悉的,并且可以用简朴的公式或许语言描摹清晰。这一点在牛顿之前,大部门人并不认可,而是简朴地把纪律归结为神的作用。

第三,这些纪律应该是放之四海而皆准的,可以应用到各种未知领域指导实践,这种熟悉是在牛顿之后才有的。

这些着实是呆板脑筋中努力的部门。呆板脑筋更普遍的影响力是作为一种准则指导人们的行为,其焦点脑筋可以概括成确定性(或许可推测性)和因果关系。牛顿可以把所有天体运动的纪律用几个定律讲清晰,并且应用到任何场所都是准确的,这就是确定性。类似地,当我们给物体施加一个外力时,它就获得一个加速度,而加速度的大小取决于外力和物体自己的质量,这是一种因果关系。没有这些确定性和因果关系,我们就无法熟悉全国。

从牛顿最先,人类社会的前进在很大水平上得益于呆板脑筋,可是到了信息时代,它的局限性也越来越显着。首先,并非所有的纪律都可以用简朴的道理描摹;其次,像过去那样找到因果关系已经变得很是坚苦,因为简朴的因果关系纪律性都被发现了。此外,随着人类对全国熟悉得越来越清晰,人们发现全国自己存在着很大的不确定性,并非如过去想象的那样一切都是可以确定的。因此,在今世社会里,人们最先考虑在认可不确定性的情况下奈何取得科学上的冲破,或许把事情做得更好。这也就导致一种新的方法论降生。

不确定性在我们的全国里无处不在。我们经常可以看到这样一种怪现象,许多时间专家们对未来各种趋势的推测是错的,这在金融领域尤其常见。如果读者居心统计一些经济学家们对未来的见解,就会发现它们底子上是对错各一半。这并不是因为他们缺乏专业常识,而是因为不确定性是这个全国的重要特征,以至于我们按照传统的方法——呆板论的方法难以做出正确的推测。

全国的不确定性来自两方面,首先是当我们对这个全国的方方面面了解得越来越细致之后,会发现影响全国的变量着实很是多,已经无法通过简朴的举措或许公式算出成果,因此我们宁愿采纳一些针对随机事故的方法来处置惩罚处罚它们,人为地把它们归为不确定的一类。

反映出在信息时代的方法论:谁掌握了信息,谁就能够获取产业,这就犹如在工业时代,谁掌握了资源谁就能获取产业一样。

当然,用不确定性这种目光看待全国,再用信息消除不确定性,不单能够获利,并且能够把许多智能型的标题转化成信息处置惩罚处罚的标题,详细说,就是操纵信息来消除不确定性的标题。好比下象棋,每一种情况都有几种或许,却难以决定最终的选择,这就是不确定性的表示。再好比要识别一个人脸的图像,现实上可以看成是从有限种或许性中挑出一种,因为全全国的人数是有限的,这也就把识别标题酿成了消除不确定性的标题。

4

大数据的本质

首先我们必需认可全国的不确定性,这样我们就不会采纳确定性的脑筋方式去面临一个不确定性的全国。当我们了解到信息或许说数据能够消除不确定性之后,便能大白为什么大数据的呈现能够打点那些智能的标题,因为许多智能标题从底子上来讲无非是消除不确定性的标题。对于前面提到的大数据的三个特征,即数据量大、多维度和完整性。在这个根本之上,我们就能够讲清晰大数据的本质。

先谈谈数据量的标题。在过去,因为数据量不够,即使操纵了数据,依然不够以消除不确定性,因此数据的作用着实很有限,许多人忽视它的重要性是必定的。在那种情况下,哪个领域先积攒下富足多的数据,它的研究渴望就显得快一些。详细到机器智能方面,语音识别是最早获得比较大都据的领域,因此数据驱动的方法从这个领域产生也就不够为奇了。

关于大数据多维度的重要性标题,可以从两个角度来看待它。第一个视角是「互信息」,为了获得干系性每每须要多个维度的信息。好比我们要统计「央行调整利息」和「股市波动」的干系性,只有历史上央行调整利息一个维度的信息显然是不够的,须要上述两个维度的信息同时呈现。第二个视角是所谓的「交错验证」,我们不妨看这样一个例子:夏天的时间,如果我们感觉很闷热,就知道或许要下雨了。也就是说,「空气湿度较高」和「24小时内要下雨」之间的互信息较大。可是,这件事并非很确定,因为有些时间湿度大却没有下雨。不过,如果团结气压信息、云图信息等其他维度的信息,也能验证「24小时内要下雨」这件事,那么推测的正确性就要大许多。

最后,我们从信息论的角度来看看数据完整性的重要性。在大数据时代,在某个领域里获得数据的完整性照旧或许的。好比在过去把全国所有人的面孔收集全是一件不行想象的事情,可是今日这件事情完万能做到。当数据的完整性具备了之后,就相当于操练模型的数据会萃和操纵这个模型的测试会萃是统一个会萃,或许是高度重复的。在这种情况下,就不会呈现覆盖不了许多小概率事故的灾难。

这样数据驱动才具有普遍性,而不再是时灵时不灵的方法论。

由此可见,大数据的科学根本是信息论,它的本质就是操纵信息消除不确定性。当然人类操纵信息由来已久,可是到了大数据时代,量变带来质变,以至于人们突然发现,采纳信息论的脑筋方式可以让过去许多坚苦迎刃而解。

5

互联网公司的篡夺和大数据应用

今日,各个搜索引擎都有一个怀抱用户点击数据和搜索成果干系性的模型,每每被称为「点击模型」。随着数据量的积累,点击模型对搜索成果排名的推测越来越正确,它的重要性也越来越大。今日,它在搜索排序中至少占70%~80%的权重,也就是说搜索算法中其他所有的因素加起来都不如它重要。换句话说,在今日的搜索引擎中,因果关系已经没有数据的干系性重要了。

当然,点击模型的正确性取决于数据量的大小。对于常见的搜索,好比「捏造现实」,积累富足多的用户点击数据并不须要太长的时间。可是,对于那些不太常见的搜索(每每也被称为长尾搜索),好比「毕加索早期作品介绍」,须要很长的时间才气收集到「富足多的数据」来操练模型。一个搜索引擎操纵的时间越长,数据的积累就越充分,对于这些长尾搜索就做得越正确。微软的搜索引擎在很长的时间里做不过Google的紧张缘故因由并不在于算法自己,而是因为缺乏数据。同样的道理,在中国,搜狗等小规模的搜索引擎相对百度最大的劣势也在于数据量上。

当整个搜索行业都意识到点击数据的重要性后,这个市场上的竞争就从技术竞争酿成了数据竞争。这时,各公司的商业战略和产品战略就都围绕着获取数据、创建干系性而开展了。后进入搜索市场的公司要想不坐以待毙,唯一的举措就是快速获得数据。

好比微软通过接手雅虎的搜索营业,将必应的搜索量从本来Google的10%左右陡然抬举到Google的20%?30%,点击模型估计得正确了许多,搜索质量火速前进。可是即使做到这一点照旧不够的,因此一些公司想出了更激进的举措,通过搜索条(Toolbar)、浏览器以致输入法来收集用户的点击行为。这种举措的优点在于它不单可以收集到用户操纵该公司搜索引擎自己的点击数据,并且还能收集用户操纵其他搜索引擎的数据,好比微软通过旧浏览器收集用户操纵Google搜索时的点击情况。

这样一来,如果一家公司能够在浏览器市场占很大的份额,即使它的搜索量很小,也能收集大量的数据。有了这些数据,尤其是用户在更好的搜索引擎上的点击数据,一家搜索引擎公司可以快速改进长尾搜索的质量。当然,有人诟病必应的这种做法是「抄」Google的搜索成果,着实它并没有直接抄,而是用Google的数据改进自己的点击模型。这种事情在中国市场上也是一样,因此,搜索质量的竞争就成了浏览器或许其他客户端软件市场占有率的竞争。当然在外人看来这些互联网公司竞争的是技术,但更正确地讲,它们是在数据层面竞争。

许多时间,落后与前辈的差距,不是购买一些机器或许引进一些技术就能够增补的,落后最可怕的处所是脑筋方式的落后。西方在近代走在了全国前方,很大水平上靠的是脑筋方式周全领先。

呆板脑筋曾经是改变了人类工作方式的革命性的方法论,并且在工业革命和后来举世工业化的过程中起到了决定性的作用,今日它在许多处所依然能指导我们的办法。如果我们能够找到确定性(或许可推测性)和因果关系,这依然是最好的成果。可是,今日我们面临的复杂情况,已经不是呆板时代用几个定律就能讲清晰的了,不确定性,或许说难以找到确定性,是今日社会的常态。在无法确定因果关系时,数据为我们提供了打点标题的新方法,数据中所包含的信息可以资助我们消除不确定性,而数据之间的干系性在某种水平上可以取代本来的因果关系,资助我们获得我们想知道的谜底,这便是大数据脑筋的焦点。

大数据脑筋和原有呆板脑筋并非完全对立,它更多的是对后者的补充。在新的时代,必定须要新的方法论,也必定会产生新的方法论。

在有大数据之前,我们寻找一个纪律经常是很坚苦的,经常要经历「假设——求证——再假设——再求证」这样一个漫长的过程,而在找到纪律后,应用到个案上的资本或许也是很高的。可是,有了大数据之后,这一类标题就变得简朴了。

好比通过对大量数据的统计直接找到正常用电模式和纳税模式,然后圈定那些用电模式很是的大麻莳植者,或许有嫌疑的偷漏税者。因为这种方法采纳的是机器进修,依赖的是机器智能,大大低沉了人工资本,因此实施的资本很是低。在美国有大量类似的报道,在各种媒体上都可以看到。

在大数据呈现之前,并非我们得不到信息直接的关联性,而是须要泯灭很长的时间才气收集到富足多的数据,然后再泯灭更长的时间来验证它,这也是过去大部门传统的企业对于细节数据的收集和处置惩罚处罚不是很重视的缘故因由,比拟之下他们更垂青经历和宏观数据。可是到了大数据时代,这些企业的观念也在逐渐转变。

亚马逊的优势在于它拥有顾客周全的信息。好比张三上周买了一台数码相机,之前他还购买了几个玩具,统一个所在的李四前两天买了婴儿用的浴液。那么可以联想到张三和李四是一家人,他们有个出生不久的婴儿,张三买数码相机或许是为了给孩子拍照。他们或许会对在线冲印照片(并做成贺年卡),或许电子相框有爱好。如果将他们的所在和美国个人住宅信息网站zillow.com联系起来,很等闲了解到他们的住房价格,进而估计出他们的收入。这些前提是沃尔玛不具备的。亚马逊的第三个优势在于它的任何市场战略都能连忙实现,好比它能够随时绑缚商品,并且随时调整价格进行促销;而美国所有的实体店,调整价格都须要在晚上关门之后进行,因此即使它们数据挖掘的速度和亚马逊一样快(当然这是不或许的),在市场上的反应也跟不上亚马逊这样的电商公司。

前面的几个例子无一不是先从大数据找到普遍纪律,然后再应用于每一个详细的用户,并且影响到每一个详细的利用。以抓毒品莳植和偷漏税为例,警察局或许税务局首先须要凭据大数据了解用电或许纳税普遍的模式,然后要正确地估算出每一个所在正常的模式,这样就能够发现每一个很是的情况。

对于互联网公司的那些应用也如此,那些公司可以对每一个用户提供不同的办事,以致做到每一次的办事都不类似。好比电商公司在用户浏览打印机或许电动牙刷时,如果发现他们在阅读产品介绍和评价,那么或许用户尚未完成购买,举荐响应的产品给用户是合理的;而当用户完成购买后,再搜索或浏览这些产品,举荐给用户打印机墨盒或电动牙刷头等耗材,就比举荐那些耐用产品自己更合理了。经常在亚马逊上购物的人对这一点会有体会,不单不同的人看到的网页内容是不一样的,并且统一个人今日和昨天看到的内容也是不一样的,尤其是在完成一些购买行为之后。这种大雅到每一次生意营业,以致每一次内容展示的办事,在过去是想都不敢想的,可是靠大数据今日这已经酿成了或许,并且它还代表着未来商业的趋势。

通过这件事我们也能进一步体会大数据完整性的特点。在过去,统计学家们不断试图寻找好的采样方法,以便在有限的样本中找到覆盖尽或许全的纪律,可是在大数据时代,这些努力都不须要了,因此样本集可以便是全集。此外,我们还可以从这个案例中看到大数据时效性的特点。对于新的、过去没有见过的情况,Google的办事器反应黑白常实时的,即在第二次就能把希奇的数据提供给用户操纵,这在大数据时代之前也是做不到的。

Google在数据上的优势,是大学和各个研究所并不具备的。即使是举世著名的汽车公司,包含丰田、民众和美国通用,也不具备如此多的数据。因此,它们当然在自动驾驶汽车研制方面早起步几十年,可是很快就被Google超越。此外,打定机进修「经历」的速度远远比人快得多,这也是大数据多维度的优势,因此Google自动驾驶汽车的前进才气如此快。这并非分析Google的科研本事横跨了过去那么多大学、研究所和公司的总和,反而是表示出大数据的威力,以及采纳大数据脑筋的重要性。

必应词典和微软翻译_微软必应词典在线翻译 必应辞书和微软翻译_微软必应辞书在线翻译(必应词典和微软翻译) 必应词库

让我们谈谈金风公司的故事。在和我进行了多次关于大数据时代商业模式的探究后,该公司决定向IBM进修,在商业模式上做根本性的转变,主营业务从风力发电机的制造,转变成发电设备的运营和办事。当然,并非什么公司想做办事就能做得好并赚到钱,金风公司有底气转型,源于其在宏观上对举世风能市场的了解,在微观上对每一台风能发电机运营细节的了解,加上通过大数据对发电机或许呈现的标题的阐明,能够比日常工程公司更有用地维护发电机。至于发电机的出产,该公司只负责研制,然后将设备制造交给其他公司去做。这样一来,金风公司就在风力发电领域成功地复制了IBM办事的模式。大大都亚洲制造企业当然在举世市场上占的份额不小,可是每每竞争的本事就是压低利润降价,最后把整个行业变得都没有利润。金风公司转型的做法,或许能给这些企业一些启发,当然如果没有大数据这样的时机,这种转型黑白常坚苦的。

与金风公司面临类似情况的尚有诸多的电器出产厂商。这些电器无论是高端的照旧低端的,厂家只能赚到一次钱,并且因为亚洲制造业同行彼此压价,利润也不或许很高。为了打点利润的标题,一些对新技术敏感的公司想到了操纵大数据和移动互联网来改变商业模式。

6

现有产业+摩尔定律=新产业

与前两次工业革命类似,当然信息革命的代表产品是打定机处置惩罚处罚器,可是并不须要每一家公司都出产处置惩罚处罚器,以致不须要每一家公司自己开发软件。今日大部门公司操纵的处置惩罚处罚器只有两个系列,即英特尔x86系列(加上AMD兼容产品)和英国ARM公司打算的RISC(精简指令集)处置惩罚处罚器,因此打定机现实上可以被看成是一种资源,而大部门公司须要做的只是操纵好这些资源而已。

我们回首过去是为了预测未来。以后,由大数据激发的智能革命也将是以一种与前面反复技术革命类似的方式展开,如果我们用两个简朴的公式来概括的话,那就是:

现有产业+大数据=新产业

现有产业+机器智能=新产业

摩尔定律和安迪-比尔定律到了智能手机时代照旧实用,我们就不赘述了。

通过上述对历次技术革命中商业模式变迁的阐明,我们可以获得这样三个结论:首先,技术革命导致商业模式的厘革,尤其是新的商业模式的降生。其次,出产越来越过剩,需求拉动经济增加的模式变得不行逆转。同时,纯真制造业的利润越来越低,那些行业越来越没有出路。相反,人们对办事的需求越来越激烈。在IT时代,唱主角的公司逐渐从制造设备的IBM、爱立信、诺基亚和惠普等公司,酿成了提供软件和办事的微软、甲骨文和Google等公司。最后,商业模式的厘革既有担当性,又有创新性。工业革命导致了产品须要靠推销才气卖出去,第二次工业革命导致了广告业的兴起,推销的方式从展示酿成了做广告,而这两者之间是有联系的。作为创新的一方面,第二次工业革命导致了商业链的呈现;到了信息时代,商业链获得了成长,这是担当性的一面;而办事业的重要性突显,这是其创新性的一面。

【转载须知】

1、本文为投资人说(ID:touzirenshuo)编辑作品,受《著作权法》保护,依法享有汇编权及诠释权;

2、未经授权转载必究,如需转载请在公众号配景留言或添加微信号:maserati_dong。

感谢阅读。

Tags: 数据 脑筋 微软 不确定性 公司 呆板 方法论 信息 互联网 标题 简朴 方式 全国 的是 它的

服务热线

131-1198-7613

功能和特性

价格和优惠

获取内部资料

微信服务号