网易科技讯 9月2日消息,2010 百度 世界大会今日在北京举行, 网易科技 作为门户合作伙伴将对本次会议进行全程图文直播。
以下为“技术和开发者论坛”的文字实录:
主持人:尊敬的各位来宾,女士们,先生们,大家下午好。欢迎大家参加今天下午的分会场演讲,我是来自百度技术部的主持人张博,本场的主题是“技术拥抱开放”,如今的互联网已经从拼创意的阶段进入了拼技术的阶段,各家互联网公司都有一些自己独门的武林秘籍,技术不同于产品创意,它更需要同业内的同行进行交流,在交流沟通中完成自我的提升。在这个初秋的下午,百度将向同仁展示自己在技术开放上取得的一些进展,相信会令大家感到不虚此行。首先让我们欢迎百度公司高级技术总监王梦秋女士为今天下午的分论坛致辞,有请。
王梦秋:各位来宾,各位热爱互联网技术和产品的同仁,大家下午好,非常欢迎大家来到今天下午的百度世界技术与开发者分论坛,如果大家参加了上午的会场,可以听到,,我们在过去的百度世界上提出了“框计算”的概念,过去一年来百度为了把“框计算”落地落实,进行了大量的探索和实验,在我们的探索和实验中,我们发现要实现框计算无所不能,无处不在的特点,有一个基本的条件就是开放。为什么这么说呢?
首先,用户的需求在过去十年来发生了巨大的变化,用户对框里输入的需求越来越复杂,需求串本身也越来越长,这表明用户的需求需要一个更加精准,更加准确的答案,另外,用户不仅仅需要一些文本的匹配信息,他在互联网上的行为越来越丰富,他也希望能够通过框找到我们更多的应用,更丰富的交互行为。另外一个方面,互联网上的信息越来越多,应用越来越多,浩如烟海,现在全世界有两亿多的网站,这一切都给我们的搜索引擎提出了非常大的挑战,我们怎样从这样浩如烟海的信息找到用户需要的有价值的信息和应用?百度的答案就是我们必须打造一个开放的平台。我们希望能够集合全互联网的力量,我们希望结合全互联网网民的力量,我们希望集合全互联网应用开发者和资源拥有者的力量共同为网民打造更好的搜索体验、计算体验。
因此,百度在过去一年来,推出了很多的开放的平台,我们不仅希望通过这些开放平台能够给用户打造一个更好的体验,我们也希望给中国的互联网圈打造一个非常好的生态系统,使各位资源拥有者,各位应用开发者能够通过百度的开放平台实现共赢,实现互利。今天下午的分享包括百度开放应用平台、百度开放数据平台、百度开放知道、百度开放地图API四个环节,希望大家能够在这个环节的分享中得到你们想要的知识,碰撞出一些新的火花。我今天要讲的就是这些,谢谢大家。
主持人:谢谢王梦秋女士。下午第一场演讲的题目是百度应用开放平台,为我们演讲的是百度产品架构师田晓萌女士。百度应用开放平台是今年百度世界大会的一个热门话题,大家可能会有疑问,百度应用开放平台与框计算有什么关系,下面就有请田晓萌女士为我们做一个详细的解释,有请。
田晓萌:谢谢主持人,非常感谢各位远道而来,我也非常荣幸能借此机会向大家简单介绍一下两天之前刚刚上线的百度应用开放平台。今天中午我刚刚得到一个消息,从百度应用开放平台上线大概是只有两天多的时间内,我们已经收到了超过60家第三方应用平台向我们提交的合作申请,在此,除了能够看到大家对我们新的模式的认可之外,也非常欣喜的让我们看到大家愿意和百度共同为了帮助用户提升体验所付出的努力跟热情。
下面,我先简单向大家介绍一下为什么百度要做这样一个应用开放平台。首先每天我们从百度发现有来自138个国家的数十亿的请求,其中应用占30%的比例,我们发现从最初搜索引擎单纯的以静态信息为主,慢慢演变成以信息加上应用的复合需求,这无疑为搜索引擎如何更好的满足用户的体验,更精准,更高效满足用户的体验带来了更高的挑战。
我们发现另外一个有趣的现象,我们发现在美国Top APP的应用平台超过50万,但是在中国Top APP平台只有两千到三千,为什么会产生如此悬殊的差距,是不是中国缺乏一些开放应用的人才呢?我们发现另外一个很有意思的案例。在Facebook排名前两百名的团队中有超过一半是华人开发团队完成的。有大量优秀的开发者在为国外做开发,我们进一步研究发现主要有这三方面的原因。第一,缺少大流量、大规模需求稳定的用户的平台,国内主要的APP的平台缺乏稳定的用户,包括大的流量。第二,缺乏多元化的收益模式,国内比较有名的几个,以APP为主的平台,他们的收益模式相对比较单一,主要可能还是以收费分成为主。第三,在中国有大量的合法权益无法得到充分的保障。设想一下,在座的各位如果有一些开发者有自己比较好的主意,创造出一些比较能够符合大家体验,比较受用户需求的应用的话,却往往经常很容易被其他人剽窃这样一些创意,发布到整个互联网上,让大家的权益很快的得到侵犯,并没有办法得到充分的保障。我们认为主要是这三方面的原因导致在中国APP发展遇到一些瓶颈。
于是,我们认为作为全世界第一大的中文搜索引擎,我们需要搭建一座桥,这个桥的一端是非常有实力的开发者,另外一端是有大量需求的用户。我们需要开发者提供切实实在的利益让他们大施拳脚,通过这座桥让我们的用户更精准高效的满足需求。我们相信大家加入我们就可以为大家带来前所未有的价值,能够为互联网贡献出巨大的力量。这是我们打造百度应用开放平台的根本原因,也是原动力。下面请允许我简单介绍一下百度应用开放平台到底是一个什么模式。
首先我们希望能够有这样一个平台,我们提供完整的开放机制,能够让我们广大的第三方的开发者可以向这个平台输出各种各样的应用,可能有APP,有付费的,有免费的,有独立的,有基于网页搜索或者其他终端的,有各种各样的应用。同时,这些应用可以输出给百度以及非百度的其他所有的平台。我们认为这套体系一个最重要,最核心最根本的原因是在于是否能够输出充分的利益给开发者,这一点是直接决定这个平台是否能够重新顺畅、完整循环的一个最根本的原因。
说到这儿说一个笑话,回家的时候,我的父母会问我说百度做搜索为什么需要那么多人,不就是一个框吗?搜完就会出来相应的结果,我在北京坐出租车的时候也有很多司机会问我在哪个公司?我说在百度。“做搜索。你们有多少人?”我说我们有接近一万人。有的师傅就会说搜索引擎不就是个框吗,为什么需要那么多人?其实这里面是一个非常非常复杂的问题,首先从用户在这个框了输入需求,到我们进行相应的一系列的语意分析,所有行为的分析,包括智能的分析,最终我们要确定这里面哪些需求是跟应用相关的,哪些需求应该直接传导大应用开放平台,跟应用平台产生互动,把这个反馈给用户,这仅仅是开始的前端。后台我们如何搭建一套完整的开放机制,包括开放的认证机制,开放的授权系统,开放的组建化的服务,开放数据接口,如何提供这一系列的服务,从用户需求到最后开放所有的应用,发生一个非常完整的互动,这一系列是一个非常非常复杂的过程,任何一个环节出了问题,都容易让用户的需求得不到满足,甚至更严重的是,让用户的需求受到伤害。
一个非常简单的中文我有38种表达方式,从这个框最开始的输出,到最有价值的需求返回是一个非常有价值的过程,百度的使命就是要依托于博大精深的中文智慧,秉承以用户为导向的根本原则,致力于为用户提供简单可依赖的互联网搜索服务,这就是百度的使命。下面我们简单看一看应用开放平台跟搜索引擎之间如何形成这种有效的最简单最可依赖的互动方式。
首先,用户在搜索框里输入他的需求,例如“坦克大战”,点完搜索之后,所有的应用将直接呈现在大家面前。点击具体的应用,他便进入游戏界面,可以在这里面直接来玩。这是进入到游戏的界面。这个非常怀旧。如果他觉得这个应用非常符合他的体验,他可以选择添加,当然,前提是他首先登录过。下一次他再搜索“坦克大战”的时候,他添加过跟定制过的应用会出现在搜索结果的最前面,不用再在海量的数据中进行寻找。同时他还可以在这个应用的下面查看其他用户的所有评价,他也可以自己在这里面输入评价。
我们非常欣喜的看到这是搜索引擎本身非常大的突破,为什么?原因是所有的过程都是在搜索结果直接完成的。通过开发者跟百度的共同努力,我们将用户对搜索引擎的需求整个的行为路径大大缩短,让他的需求能够最精准的直接完成。
下面我们来看一下我们现在上线的一些典型的应用案例。这是刚才介绍过的跟小游戏相关的案例。还有一个案例,用户可以在网页搜索结果这儿直接实现在线杀毒,大家可以试试,评价还是蛮好的。
最火的《一起又看流行雨》,大家可以在搜索结果直接看湖南卫视的直播,当然我们还可以在搜索结果直接听歌。所有的应用我们上线的远远不只这几款,大家可以到线上体验一下。
我们还有一项举措是针对以内容为主的APP,我们未来将提供整体的分装工具,降低开发门槛。也许有人会想,也许我不是一个非常擅长技术的开发者,但是我有非常好的原创内容,比如文学作品,比如一个小说,比如我是一个音乐的创作者,我又不懂技术,不会开发怎么办?对于这样以内容为主的APP,百度会提供完整的分装工具,大家不用担心我不会开发,怎么办的问题,通过这个工具会非常便捷的生成一系列的APP,直接上传到我们的网页搜索当中。以韩寒的《三重门》小说为例,韩寒已经上传到我们的网站,用户可以在搜索结果直接实现整个的阅读过程。我们这套工具对个人开发者最大的价值就是将大大降低我们的开发门槛。我们相信在不久的将来,广大的开发者会跟百度有越来越多的合作,这些合作将遍布各个领域,将最大可能的满足用户在各个方面的检索需求。同时,最重要的是让广大的开发者通过搜索引擎获得最大的利益。
接下来是很多用户最关心的一点,我们将为广大开发者具体带来什么。第一,我们认为我们将为大家带来最多的用户和最大的流量。每天数十亿的来自138个国家3亿用户的检索需求中有30%是跟应用直接相关的,我们相信这个海量的数据将直接为所有的开发者带来最大的价值。第二,最多元化的收益模式,利润触手可得。首先目前广大的APP平台,不管是国内还是国外,最直接的付费分成方式,百度提供给大家是目前在行业内部比较有竞争优势的分成方式,我们会将70%的利润直接分发给开发者。其次是广告收入,我们允许开发者将广告直接插入到他的应用中,当然,前提是第一,不要影响我们的用户体验,第二,广告的内容以及广告本身的质量是非常好的。在这样的前提下,我们允许大家将广告插入到APP中,获得更高的收益。可能有些人也会比较好奇,如果我们不是很大的平台,本身没有广告来源怎么办?接下来百度也会针对这方面提供配套的广告工具允许大家使用。当然,我们相信也有非常大量的开发者会说,其实我有一个很好的应用,但是我既不想要广告,我也不想付费,我只是想免费的提供给广大的互联网用户用,对于这样的开发者,我们提供了一种方式,就是捐赠,我们相信有非常多的用户会通过这种途径向非常好的开发者表达大家的敬意和感谢。
第三,百度的应用平台可以给大家提供最直接的品牌展现,扬名立万的机会。大家搜索一下在线杀毒。这里面将有对相应的提供者一个最详细的介绍。这些都是在搜索结果以最精准的方式给大家一个最直接的品牌展示。
第四部分我们认为最重要的是一个权益的保障。我们经常举一个例子,百度这边有一个非常典型的搜索就是《斗破苍穹》,这个小说每天的检索量在百度靠近百万,但是有相当大的一部分流量被其他的一些不法的权益侵犯者所获取,我们认为通过百度的APP开放平台,除了这样的小说,绝大多数正版的APP应用,我们都能对原创和正版内容有最直接的展示,让大家在鱼龙混杂的互联网资源中脱颖而出。这些开发者除了保障自己的权益,最重要的还是通过刚才说的三种方式通过跟搜索引擎中跟用户的交互来获得最大的利润。
说到这儿有些人会很好奇,如何加入到我们这个平台中?8月30日正式上线,有两种途径可以加入我们,第一种就是邀请,在座各位有相当多的站长或者开发者已经获得了相应的邀请资格,我们会在百度世界两周后内统一发送邀请函,请大家注意接受邮件,如果没有接到邮件,大家可以发到指定的邮箱地址询问进展。是不是没有邀请就不可以加入?还有一种重要的方式就是申请。您可以来申请,大家可以在一周之内收到您的审核结果,如果一周内未收到审核结果,也可以发信到相应的邮件组询问进展。尽管我们上线还是蛮低调的,但到现在才短短两天多的时间,已经收到60多家开发者的一些合作信,我们也邀请在座的各位开发者加入我们。
经过大屏幕上的五个步骤,当然,前三步,第一步是刚开始的时候需要进入的,如果第一步已经走通的话,你只需要简单的两步,第一提交你的应用,第二通过审核,你的应用就可以与三亿用户直接见面。
海阔凭鱼跃,天高任鸟飞,如果您是一个有实力的开发者,同时您富于创新,如果您想让最多的用户使用您的应用,如果您想让您的应用为您创造最大的价值,无论是金钱还是名气,如果您想和百度共同为四亿网民创造最大的价值,我们邀请您,我们有最多的用户,最大的流量,最多元化的收益模式,最直接特色的品牌展示,最多的权益保障,百度邀请您一起成长,非常感谢。
主持人:谢谢田晓萌。百度应用开放平台是一个宏大且意义深刻的产品,它是框计算里在网页搜索端的具体体现。作为其中的重要组成部分,作为其中的重要组成部分,百度数据开放平台在过去的一年里都取得了哪些进步呢?下面为大家演讲的是百度网页产品经理金海燕女士,金海燕作为百度数据开放平台的负责人,对这个产品有深刻的理解,今天她演讲的题目是百度数据开放平台,有请。
金海燕:大家下午好,欢迎大家出席这个论坛,接下来我会跟大家分享我们数据开放平台在这一年里的进展,我们遇到的问题。先跟大家分享一些数据。我们的开放平台已经有四百多家的合作站点,这张图在上午的PPT中也有展示,这些合作伙伴给我们带来了大量优质和官方的资源,给我们带来各式各样的,给网民的生活、出行学习工作商务等等各方面带来便利的框计算结果。
这是通过数据开放平台进来的框计算结果的流量覆盖,每天我们的四百多家的合作伙伴得到的展现的次数。根据我们最新的统计,在上一周流量的数量已经过亿了,从这张图上我们可以看到这个流量增长是非常迅猛的,现在我们已经是我们推出第一周的六百多倍了。从平台开放到今天,平均每天新加入的流量是20万左右,并且我们可以预计到接下来还会有更加快速的增长。
1+1+1+1+1,一共五个1,这是我们开放平台可对接的数据对象类型,第一个1是单一的数值,客服电话,用户想要的就是一个数值。第二个1是交互操作,用户在我们界面上有一个交互的动作。第三个是单一的数据库,我们的查询结果来自于一个封闭的数据库,第四个是一个多元数据库,多元数据库是指在这个行业内存在多家优质的资源,资源方按照我们的数据规范给我们推送数据,我们实现实时的结构化的检索,使我们的用户体验变得更好。这边举的例子是招聘,招聘这类需求在搜索引擎的需求中是一类比较典型的,满足复杂化的一类需求。
为什么这么说呢?用户的表达词是软件工程师招聘,他把职位需求明明确确的表达出来,是否我们给他一个表达软件工程师招聘的结果就能满足他的需求了呢?并不是。用户的需求还包括比如时间,他想要的是今天的,近期的,有效的招聘信息,而不是过去的,去年的甚至前年的互联网上发布的招聘信息,用户隐含的信息有我要在哪个城市找这份工作,也隐含着对薪水的需求,甚至包括我希望找到的信息是多条的,可以让我挑挑拣拣,选择最满意的那一条信息。按照我们搜索引擎的经典模式是很难满足这种需求的,甚至单个数据库也是很难满足这种需求的,所以,我们数据开放平台可以引入多元的数据库,更好的满足用户实时的结构化的查询需求。
第五个1是外部垂直检索系统,这边这个案例是我们即将上线的案例,我们的系统能够识别出用户,在查找用户需求的时候,我们可以从外部的数据库里实时的寻找结果。在过去的这一年时间里,我们通过对底层技术架构的改造,以及非常复杂的一个数据流对接完善,现在已经可以对这五种类型的数据对象都可以支持,能够将这五种数据类型对象通过我们的开放平台跟我们框计算结合,做一个无缝的对接。
1—N,这是什么意思呢?我们既然将优质资源和关键词通过这个平台提交过来以后,我们系统会自动的在我们的日常用户表达词里匹配,将表达同一种需求的多种表达方式找回来。金华天气,根据最新的统计,现在我们系统找回来的表达方式有94种,我老家就是金华的,我的老乡现在在百度这边用各种表述词检索的时候都能看到金华天气提交过来的资源,不管是用金华天气还是金华未来一周天气状况是怎么样的,这样复杂的词都能看到这样的结果。并且是在本地的时候,即使不加金华这个地点的限定,也一样能看到这个结果。
第二个例子是美元和人民币的汇率,根据昨天的统计,我们系统找回148种表达方式,用任何一种表达方式都能搜到这个结果,就在第一个。
以上两个案例反映出来是在过去这一年我们的系统在需求分析和解析方面取得了一个长足的进步,这使得用户形形色色的表达他常规需求的需求表达都能得到反馈,也能使得我们的优质资源方提交过来的资源得到最充分的利用和展现。我们继续来看数据。
又是一个1亿次,在世界杯期间我们用户总共查询次数,我们合作伙伴跟我们基于数据开放平台的合作,可浏览化的方式来展现,实时的报道比赛的比分跟比赛相关的信息,大大改善了楼索引擎用户的搜索体验,同时这种独特的展现方式也为我们的合作伙伴带来了可观的流量,可观的用户,大大增强了网站的品牌。
上升50%,这个是多玩网给我们发来的感谢信反馈的。通过副本,通过任务查询到达多玩网的用户正是他们的目标用户群。
在过去平台开放的这一年多时间里,我们陆续受到站长给我们很多的反馈,其中不乏中肯的建议和批评,更多的是对我们平台的感谢,良好的祝愿,以及对开放这个模式的赞美。开放是搜索引擎迈出的巨大一步。在王梦秋女士刚才的致辞中说,开放使得搜索引擎全面进化到了和谐时代,简单的说,对于网站来说,它由一个被动等待搜索引擎来抓取,来更新,来排序,来展现这么一个状态,进入到了可以主动的影响搜索引擎,可以指定的内容,指定的关键词,指定的位置,指定的样式甚至周期。总结起来,开放平台能给站长带来的最主要价值体现在四个方面,首先,最权威的展现使得用户对官网有更加直截了当的认知,使那些作弊的虚假的信息收益不能获得,使其在同质资源竞争中非常容易的脱颖而出。网站跟我们平台免费合作的模式最直接的收益当然是大量的用户及流量。对于电子商务这类型的网站来说,稳定的流量和用户源源不断的高价值的流量和人气能够直接转换为网站的商业利益。
以上是开放对于网站的收益,实际上我们更希望打造的是一个互利共盈的搜索引擎生态圈,搜索引擎以网站的优质资源为基础,给我们的用户提供更好的服务,精准的,直接的,快捷的,直接满足用户的需求,最终形成一个搜索引擎、站长、用户共赢的生态圈。
在过去一年多的时间里,我们也遇到过种种的问题,接下来我跟大家分享一下我们对这些问题的看法,以及接下来我们应对的机制。
第一个问题,这是我们在试运行阶段遇到的问题,站长提交的资源很多是没有被审核通过的,根据我们统计这个比例还不低,这些数据不被通过的最主要的原因是什么呢?最主要的是三个方面。第一,提交的资源跟关键词不匹配。第二它指定的展现是不合理的,第三网站提交过来的资源不真实,不完整,不准确。
我举几个例子给大家,比方说我们收到有站长给我们提供虚假的客服电话,比方半年以前的招聘信息仍然混杂在其中。比方提供给我们的信息里商品的价格跟网站上实际的报价是不符的,这样的信息如果进来,对我们的用户不但是没有帮助的,而且会造成很大的伤害。站在我们的立场,相信诸位也会以相同的理由来拒绝这样的数据通过的,从站长的角度来说,我相信也并非所有的站点都是故意要提交虚假的,不真实,不准确的信息给我们,站长这边也遇到了诸多的困难。
总结起来是这么四个方面:第一点,不同行业的站长对优质数据标准在理解上出现了一些偏差。在指点资源所对应的关键词,对应的展现,以及组织结构化的数据的时候遇到了一些问题。
针对试运行阶段遇到的问题,我们对我们的运营思路做出了比较重大的调整。现在底层的这些技术支持改造已经完成,我们的运营机制也已经到位,接下来我们就正式进入到一个垂直运营阶段。什么是垂直运营,简单的就是将搜索引擎需求进行预先的细分,按照领域对站长进行开放。垂直运营具备三个显著的特征:特征1,划分到一个具体的行业领域以后,资源收入和审核的标准就可以非常的清晰,这是软件官方下载的收入标准。特征2,划分到一个具体的内容以后,我们都有一个很全的站长帮助指南,这是招聘的一个判断。特征3,针对每一个内容,我们提供最适合它的一个资源提交方式,比方说是一个数值,提供的是一种所见即所得的资源提交方式。是一个数据库,是一个格式化的制状的数据提交方式,我们希望最终用户是能够非常简单快捷的满足他的需求的,我们的站长也是能够非常简单容易的将他的数据能直接对接到我们的框计算结果上。中间这个复杂的计算的匹配的过程就留给百度吧。
这个大屏幕上是我们现阶段重点开放的一些运营类目,六大运营类目,有的站长就会问,是否除了这些类目以外的其他类目现在关闭不开放了呢?当然不是的。对于不在以上几个类目里其他的类目所对应的资源,我们现在仍然提供两种提交的方式。第一种,当您对您的资源所对应的用户关键词以及他合适的展现形式比较有信心的时候,我们仍然提供全量支持这样的提交机制。另外,您不太有信心您的资源应该长成什么样,以及它的数据格式应该如何组织,这时候您可以提交一个对您的资源的简单的描述给我们,我们会对您的资源的sample,对站点的资质进行审核,审核通过以后,就会进入优质资源储备池,在优质资源储备池里,我们接下来对类目进行规划和设定的时候,我们就会跟您一起对您的资源设定一个最适合它的展现形式跟适合它的展现结果。
多家同质优质资源如何处理,这是大家都非常关心的问题,我们的一个独特的展现方式,以及最优的位置,意味着绝对的竞争优势,这是否会破坏这个行业里一个正常的良性的竞争,以及在运行中也有站长给我们提这样的问题,线上已经有这么一个天气资源存在了,我们也有这样的一个资源,我们要如何去提升我们这样的资源,打造我们的资源,让它更优质,什么样的情况下才能符合,能够把线上的这家资源替换下来。这就涉及到多家同质资源如何处理的问题,这也是我们一直在思考的问题。之前我们是从用户角度进行考虑,只要有一个结果就能完全满足我的用户需求了。所以,我们只接收一家优质资源,现在我们从站长收益、搜索引擎用户体验,以及互联网的良性竞争环境等诸多方面综合考虑,接下来我们会推出一种新的解决方案。这种解决方案中会引入多家资源的一个竞争机制,这是接下来的一个简单的演示。
我们会审定一个基本的审核标准,符合这个资质标准的多家资源都可以进入到我们的优质资源储备池里来,这些资源我们会在这个结果里同时得到展现,其中有一个结果是默认展开的,其他的会以Top的方式进行展现。这里就涉及到哪一家资源可以默认的展开展现的问题。我们会采用基本的三个判断原则,第一个是先到先得,在资源的优质程度没有太大差异的前提下,首先通过审核的资源就可以默认的展现。所以,已经在线上展现的这些资源仍然会默认的展现。原则二是优质为王,当几个资源在质量跟优质程度上出现明显差异的时候,我们会选择最优质的结果展开展现。这里面又涉及到判断的标准和原则是什么,经过我们在开放这一年多时间里积累的经验,以及我们基于百度后台大量的用户行为数据统计,我们已经积累了这么一套判断原则和标准,接下来会结合一个具体的行业会颁布这样的一个判断的原则和标准。
第三个原则是退场机制,也就是进入我们优质资源,默认展现,以Top形式展现的资源都会被我们定质地,审核他的资源的质量情况。当质量出现问题的时候,就有可能被退场。现在我们的优质资源储备池的一个审核已经正式的对外开放了,感谢以前已经给我们提交资源的优质站长,也欢迎非常加入我们的站长踊跃的给我们提交资源。以上跟大家分享了我们这个数据平台的进展,问题,以及我们的运营新模式。会加入我们,以及有兴趣了解更多的朋友,可以直接访问我们的首页,谢谢大家。
主持人:感谢海燕的精彩演讲,在过去的一年里,百度数据开放平台可谓是硕果累累,我们也预祝百度数据开放平台在接下来的日子里为广大网民和优质站点之间搭起一座稳固且不断提升的优质之桥。下面为我们演讲的是百度知道产品经理李锦飞先生,他演讲的题目是百度知道开放平台。百度知道在今年发布了针对合作伙伴的百度知道开放平台,对于开发者和站长来说究竟有什么价值,下面有请李锦飞先生为我们做一个具体的讲解。有请。
李锦飞:各位来宾,各位互联网从业者,各位互联网的狂热爱好者,大家下午好。非常荣幸接下来由我代表我们知道的研发团队为大家介绍一下我们的开放平台。首先我想给大家解读一下,我们百度知道的研发团队对于开放平台的解读。
首先什么叫开放?我们所理解的开放主要有三点,第一点是开放的心态,决定我们开放的态度,开放的态度决定我们开放的行为,保证我们开放平台运作正常。第二是开放数据,百度知道是一个已经发展了五年的非常成熟的优良平台,我们积累了大量优质的数据,如果把这些数据的结果开放的话,它所带来的价值是不可估量的。第三是开放功能,它所指的开放功能,我们会开放功能的接口,让用户很方便的参与到我们功能中来。至于平台的解读,我们认为百度知道是这个平台的中心,但它绝对不是这个平台的重心。我们觉得这个平台唯一的重心就是用户,只有用户的体验是最佳的,这个平台才能得到大家的认可。
今天我主要从四个方面为大家做一个介绍。第一个是我们平台的思路,为什么这样做是有价值的。第二点它为什么是可行的,为什么百度知道做最合适。第三点我们目前已经成熟的合作模式是什么样的,我们规划中的合作模式是什么样的。第四点,经过百度知道开放的平台,我们从上线以来到现在四个月的时间里,我们所取得的一些进展是什么样的,我们所取得的一些优秀的案例是什么样的,给大家做一个简短的展示。
首先这个平台的思路,这是根据我们的调研,我们觉得虽然百度知道是一个非常专业的问答平台,但是依然有大量的用户是在垂直的网站和垂直的站点里面。为什么是这样呢?当用户有这种提问需求的时候,它最便捷的方式是在它当前的网站,当前的环境里去操作,这一点百度知道存在一个可触性的链式。
第二,目前来讲这种提问和回答的需求,它的资源分布不是特别的平衡。第三个方面,所积累起来大量的问答类的数据不能得到更加有效的利用。我们觉得通过百度知道开放平台,能够为这些网站以及这些用户解决以上的问题。主要是四个方面的类型的网站。第一个类型的网站是有提问需求,但是回答能力相对不足。第二个方面是说我有大量这种专业资源,但是我缺少相对提问的需求。第三个方面是我有问答的需求,但是我没有这样的平台,没有办法把表达的需求满足起来。第四方面是我有这方面的资源,但是不能很有效的去推广到更多的用户,让更多的用户体会到它的价值。
平台思路的第二个方面,我们认为这个网站能够跨平台的去协调各个网站的优势资源,调剂知识余缺。百度知道允许同一个网站的用户之间进行互相的提问和回答,同时我们也允许不同网站的提问和回答有直接的问答的互通。第三个方面,把大量的数据积累起来之后,我们能给它得到最佳的展现,让它的价值被更多的浏览所认可。第三个方面,我们的开放平台能够让深度用户和专业网站找到自己所需要的另一方。对于用户来讲,他会有在多个网站满足他专属的需求,但是怎么找到最专精的网站,这需要我们有一定的匹配。对于网站来讲,也希望我们提供的功能切切实实提供给潜在的目标用户,比如美食网站的定餐,手机网站的手机的购买,医疗网站的求医问询。
在建设完这个平台的思路之后,将为大家解读一下为什么我们觉得百度知道做这个事情我们认为是最合理的,最合适的,是因为我们具有这种平台的优势,主要是三个方面。第一个,百度知道是一个专业的问答平台,我们在问答领域是最大的互动中文问答平台,我们有这方面的影响力和号召力。根据我们第三方数据的统计,目前百度知道平台在问答领域的市场超过80%绝对领先优势的比例。第二个方面,我们通过五年的积累,我们有百度最领先的问答平台的建设理念,同时我们有业界一流的工程师,我们会在这个产品上持续的投入我们的研发力量,改变这个平台的体验。
第三个是一个非常有吸引力的一个点,我刚才也有提到我们是一个完全开放的心态做我们这个平台,所体现的是一种无私的爱,为了让这个平台有一个更广阔的未来,我们提供大家所紧缺的东西,什么样的东西呢?那就是免费的带宽,免费的服务器,完全由百度知道来提供。
这个平台从上线以来,四月份开始推广以来,我们是在做持续的改进,从来没有停止过。6月份的时候,我们让这种提供更加有针对性,8月份的时候,我们推出了专家,让专家用户能够参与到我们平台里来。
第三个方面,也是我们提供给我们合作伙伴的利益,这个平台如果想让它健康的运转,怎么提供最合理的利益?第一个方面,我们的百度收录和展示合作网站的优秀的问答资源,这是一个例子,大家可以看到已经有一些资源提交到结果里了。同时,百度知道也会收录和展示来自合作网站的优秀问答资源,引导深度的潜在的目标用户能够直接到达,这是我们跟好大夫合作展示的一个案例。
第三个方面,相信大家现在非常期待,我们这个合作模式到底是什么样的,合作模式主要有三个,第一种模式就是搭建问答频道,一个合作条件是这样的,目前已经有独立的网站,但是没有一个这样问答的平台,百度知道可以帮助你搭建。合作方式是我们会跟合作方之间有一些数据,包括用户层面的切口的互通。合作的利益,可以非常低成本的快速的在自己的网站上搭建一个这样论坛的平台,所带来的用户体验,有价值的流量。
第二种合作模式是数据互通的模式,这种模式也是为我们的某一些网站量身订做的,这些网站的特点是说我是独立的运营网站,我已经有比较专业的问答资源或者我有非常强的网站的运营能力,但是我不是特别需要搭建一个这样的平台,或者我已经有了这样的问答平台。这种时候怎么让我数据积累的更快,怎么让这个数据得到展现呢?这是我们数据互通提供给大家的,合作网站,百度知道通过数据接口的互通,能够让我们问答的数据流通起来。目前这个模式我们正在加紧开发,目前还没有推出来。
第三个模式,频道和数据模式的结合,这个也是对我们网站量身订做所提供的,它的合作条件是我现在有这样问答的平台,我希望更多的去发挥我回答资源的价值。合作方式我们是通过合作频道,基于我们的问答频道,去实现数据的互通。合作带来的意义,用户方面会增强用户的黏性,我们对战略内容的使用价值也会有进一步的提升。
在向大家介绍完这三个部分之后,大家也非常希望了解我们这个开放平台从4月份上线以来,我们目前所取得的一些进展是什么样的,一些优秀的案例都有哪些。我们目前的优秀案例是跨多个行业,这是我们游久网,跟我们的游戏网站所做的一个合作。这是我们的精品学习网。这是39健康网,属于医疗类的。阿邦网,属于生活类的网站的合作。万车网,汽车网站的合作。薄荷网,以娱乐和健康这方面的合作。大家可以看一下,我们目前的合作可以说遍布多个行业,我们有教育,游戏,生活,汽车,医疗,还有时尚多个领域,目前我们合作还是在持续的推进,截止到今天,我们的合作数据已经合作的网站已经达到249家,这是我们在4个月的时间内取得的成果。
我们所取得的数据,一方面说我们自己做了非常多的努力,但我觉得更少不了合作方网站的无私的支持,我希望在座的各位互联网同仁能够更多的去支持我们这个平台,更积极的参与到我们这个平台里,让我们这个平台真正发挥,让我们更好的获取信息,找到所求。谢谢大家。
主持人:感谢李锦飞的精彩演讲,相信百度知道开放平台会给大家带来更高品质的体验。随着百度地图API的开放,越来越多的第三方站点借助百度地图创造了很多个性有趣个性化的服务,从而提升了竞争力,目前有新浪乐居、8684、广州视窗网等网站都使用了百度地图API,什么是百度地图API,合作网站如何来使用API呢?下面有请百度地图技术经理谢建家先生为我们答疑解惑,有请。
谢建家:大家下午好。现在由我给大家介绍地图API,开讲之前先请大家看一段小视频。我的演讲分四个部分,第一个是开放API的背景,第二是百度地图技术,第三拥抱开放平台,最后给大家分享一些案例。下午我们的关键词是开放,LBS让开放更显商业价值,在座的各位都赶过末班车,早去太冷了,晚了没赶上,我们需要知道班车到达的具体时间。今天开车来CBD,你是否为停车而烦恼呢?有时候你是否想把你的位置分享给你的好友,随着硬件的持续升级,移动互联网的发展让你这些需求满足成为可能,仅仅是可能,还需要技术区市县。接下来我们就来看一下地图技术。
说到地图技术,不得不提地图的灵魂,数据,数据最重要的有三个方向,覆盖率,准确率和时效性,最全的数据藏在哪里呢?毫无疑问在互联网网页中,凭借长期积累的国内挖掘技术,我们从1600亿的网页中挖掘出近两亿的POI,在这么多的数据里,如何整合,并确保准确是个很重要的问题。数据整合需要成份分析,需要数据结构化,用自然语言技术可以很好的解决这个问题,使网络挖掘技术的准确率得到保证。网络挖掘数据有个好处,它时时刻刻的在产生数据,不管是晚上,白天或者周末,源源不断的生产。如何保证这些数据即刻及时的更新上线也是个问题。我们知道地图网页数十亿,传统技术光切图就需要好几天,当我们放到框计算平台下,我们惊讶的发现数据更新上线从原来的一周变成了一小时。
了解了数据,架设在数据站的功能又是如何实现呢?地图功能最重要的是检索,它既是框计算的一个具体应用,框计算更善解人意,在传统的检索中,要查从上地到国贸,要打开页面,输入起点上地,输入终点国贸,很复杂,但这里只需要输入上地、国贸。路径规划,人机交互与自动规避,使路径规划更加合理。性能优化,记得十年前,我们计算一个公交换乘要十多秒,而现在十毫秒我们都嫌多。但性能还包括客户端和网络,中国有很多地区还在拨号上网,很多终端的工作能力还很弱,可以说他们还生活在性能的水深火热中。性能在客户端和产品上我们有两个观点和大家分享。第一,加载时间短并不等于展现速度快,边加载边展现才是合理的,因此页面分解和分布加载我们做了大量的优化。下面是一些客户端的性能对比数据。
性能还应该在效果和效率上进行折中。根据网络状况,简化功能或者效果,例如我们看视频的时候可以选择高清,也可以降低质量保证流畅。上面这些地图技术说到底都是为了地图应用,我们已经有了功能非常丰富的网络地图和手机地图,但是旅游、导航领域的服务还没有得到全面的满足。因此,开放API成为必然,它是行业普及和发展的趋势,它大大降低了地图的制约门槛。最近国家在加强监管,规范行业,要颁布互联网地图牌照,那些没有资质,又有地图需求的怎么办呢?可以借助地图API实现。数据层、服务层、事态层、接口层,该架构有很好的扩展性,接口颗粒度可以选择,比如一个公交请求,你可以分别请求,也可以聚合起来请求,数据返回格式也可以自由选择。我们的API还支持Web和无线,现在外面展现的很多产品就是无线地图API开发的,一会儿大家可以去外面体验一下。
地图API开放的接口够吗?GPS导航仪要接入互联网地图要做一个专题,而没有数据怎么办?这时候我们就需要一个开放的平台支撑,百度地图开放平台,首先它的一个数据汇聚平台,各只供自己使用,也可以分享给更多的人。其次,它打破终端限制,把各类终端的应用接入到平台,例如可以在电子上使用地图,网络上查好地图结果连接到导航仪。它还是开发者的舞台,中国有非常多的地图爱好者,他们开发出来的功能往往只能自我欣赏,开放平台给他们提供了展现的舞台,例如有人可以在地图平台上开发一个基于手机定位的技术,如果把它用到长途车上,我们就可以查长途车的时时位置。开放平台还打通数据产业链,让有需求而没有数据的应用也可以实现。例如9月1号开学了,要制作一个校园专题可以进行校园数据定制,然后在这个平台上搭建专题。
下面给大家分享一些经典案例。人人网,我的校园生活,地图定制还有技术支持,乐居房产,这个平台引入了第三方的开发,并参与了数据转化和数据匹配。
艺龙网,是我们开放地图API后,最早主动支援的网站第一,他们收到的客户反馈,新上线的地图功能真是太方便了,而且速度也非常快。这是3D图,平台提供了数据存储,数据转换以及数据匹配。这是我们做的电视地图。在这个应用中,平台提供了电视浏览器的适配。互联网和地图的本质是信息整合和信息呈现,地图开放平台让你整合百度的地图资源,让你的信息呈现更加完整,开放平台让你的技术可以服务给更多的人,欢迎使用百度地图API,共同参与这个开放的大平台。谢谢。
主持人:感谢建家的精彩演讲,女士们,先生们,感谢各位参与百度世界2010技术分论坛,在这接近两个小时的时间里,我们一起展望了互联网技术发展,以及互联网开放技术接口的方方面面,从中也能感受到百度对于技术开放展示出的真诚与决心,我们希望能与互联网的同仁们一起为中国互联网技术革命贡献出自己的绵薄之力,此次活动圆满结束,再次感谢各位的光临,期待下一次的相聚。
热门跟贴