西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

百度技術(shù)沙龍第5期演講資料

8月14日
  • 百度技術(shù)沙龍第5期演講資料8月14日
  • 軟件大小:1.8M
  • 更新時(shí)間:2010-08-22 10:15
  • 軟件語言:中文
  • 軟件廠商:
  • 軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 演講稿
  • 軟件等級(jí):3級(jí)
  • 應(yīng)用平臺(tái):WinXP, WinAll
  • 官方網(wǎng)站:暫無
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

本類精品

裝機(jī)必備軟件

軟件介紹

本期的QClub活動(dòng)暨百度技術(shù)沙龍第五期主題確定為“走進(jìn)搜索核心技術(shù)”。對(duì)于普羅大眾尤其是技術(shù)人員來說,搜索引擎的出現(xiàn)很大程度上改變了我們的生活和工作習(xí)慣。生活中遇到什么問題,先百度一下,工作中遇到什么困難,再Google一下,大大節(jié)約了我們的時(shí)間。對(duì)于稍有規(guī)模的網(wǎng)站,特別是面向特定人群的垂直網(wǎng)站,提供搜索功能也是一個(gè)必選項(xiàng),比如豆瓣網(wǎng)和旅游資訊垂直網(wǎng)站去哪兒等。

搜索技術(shù)已經(jīng)不是秘密,但是卻也遠(yuǎn)未到取得一個(gè)搜索引擎源代碼后,就能立刻、馬上應(yīng)用得很好。這次技術(shù)交流活動(dòng)我們有幸邀請(qǐng)了來自百度搜索技術(shù)部的研究員殷慶軒和去哪兒網(wǎng)站的搜索技術(shù)負(fù)責(zé)人何偉平,請(qǐng)他們帶我們一起走進(jìn)搜索的核心技術(shù),來探討如何讓搜索結(jié)果更具時(shí)效性,以及數(shù)據(jù)庫技術(shù)在現(xiàn)代搜索技術(shù)中的應(yīng)用。

演講嘉賓及主題
嘉賓簡(jiǎn)介:殷慶軒
百度搜索技術(shù)部研究員,2007年從清華大學(xué)獲碩士學(xué)位后加入百度,從事網(wǎng)頁搜索相關(guān)性改進(jìn)方面的工作。目前負(fù)責(zé)網(wǎng)頁搜索的時(shí)效性、需求滿足多樣性、阿拉丁相關(guān)性這幾方面的工作。
演講主題:走進(jìn)搜索核心技術(shù)——時(shí)效性
主要內(nèi)容:“全、準(zhǔn)、快、新”是搜索引擎的四大評(píng)價(jià)指標(biāo),其中的“新”指代的就是時(shí)效性。隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)民對(duì)信息獲取的時(shí)效性要求越來越高。同時(shí)越來越多的網(wǎng)民更多的參與到創(chuàng)造互聯(lián)網(wǎng)內(nèi)容中去,互聯(lián)網(wǎng)上的新信息也在迅速的膨脹。這都給搜索引擎時(shí)效性需求的滿足帶來了前所未有的沖擊。

本次沙龍希望與大家交流一下,百度在提升搜索引擎時(shí)效性上面,是怎樣考慮的。演講者會(huì)從用戶的時(shí)效性需求出發(fā),逐步分析為了滿足這樣的需求,搜索引擎需要做哪些應(yīng)對(duì)和改變,并解釋時(shí)效性改進(jìn)方面的難點(diǎn)。演講的內(nèi)容,也會(huì)體現(xiàn)出百度工程師,他們?cè)谧鍪裁词虑,以及是怎么做事情的?/p>

嘉賓簡(jiǎn)介:何偉平
PostgreSQL數(shù)據(jù)庫研究人員和中文文檔維護(hù)人員,Perl 編程第三版譯者,Linux 集群管理員及數(shù)據(jù)庫研究人員和軟件開發(fā)人員。Qunar工程師和搜索技術(shù)負(fù)責(zé)人。
演講主題:數(shù)據(jù)庫在現(xiàn)代搜索技術(shù)中的應(yīng)用
主要內(nèi)容:搜索引擎搜索質(zhì)量與分層以及數(shù)據(jù)庫在現(xiàn)代搜索技術(shù)中的應(yīng)用。搜索引擎有量和速度之間的平衡,如何利用分層的機(jī)制實(shí)現(xiàn)速度與總量的平衡。傳統(tǒng)數(shù)據(jù)庫在處理關(guān)系型數(shù)據(jù)之外,如何在 NoSQL的大潮中看待傳統(tǒng)數(shù)據(jù)庫技術(shù)?

百度索引中提供檢索的數(shù)據(jù)只有百億條,而現(xiàn)在每天增加的數(shù)據(jù)量已是2-3億條,現(xiàn)在每一天增加的數(shù)據(jù)量是2003年一年數(shù)據(jù)的增長(zhǎng)量。對(duì)于如此強(qiáng)勢(shì)的增長(zhǎng),要對(duì)數(shù)據(jù)進(jìn)行全部索引并在200-300個(gè)毫秒級(jí)返回檢索結(jié)果幾乎是不可能的,所以就要對(duì)數(shù)據(jù)進(jìn)行優(yōu)化。

數(shù)據(jù)是有時(shí)效性的,索引可以為分最新最常使用的、不常使用的、很少使用的和很老又不用的等。所以可以多幾個(gè)索引庫,并對(duì)數(shù)據(jù)進(jìn)行整理,對(duì)于時(shí)效性不強(qiáng)的可以向后面的索引里轉(zhuǎn)移,檢索時(shí)對(duì)這幾個(gè)索引并發(fā)檢索,最后將結(jié)果合并后返回用戶。對(duì)于不用的數(shù)據(jù)只是一個(gè)保存,而不提供檢索,或是在檢索結(jié)果很少的情況下,再多增加一個(gè)鏈接"點(diǎn)擊查看更多",點(diǎn)擊后就去查找老而全的庫。雖然返回時(shí)間可能會(huì)很長(zhǎng),但是用戶體驗(yàn)的感受是不會(huì)降低的。

其他版本下載

本類軟件推薦

發(fā)表評(píng)論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載