Google發(fā)布新算法研究
2018-05-14 19:39
Google Research近發(fā)表了一篇研究性論文,這篇論文詳細(xì)介紹了一種新的搜索結(jié)果排序算法。
如果將來(lái)這一算法開始實(shí)施,將會(huì)對(duì)傳統(tǒng)排名決定因素的影響造成很大改變。短期內(nèi),這項(xiàng)研究讓我們進(jìn)一步了解了谷歌所提的提高內(nèi)容相關(guān)性的算法更新。
SEO熱線:183-6710-6210
如果將來(lái)這一算法開始實(shí)施,將會(huì)對(duì)傳統(tǒng)排名決定因素的影響造成很大改變。短期內(nèi),這項(xiàng)研究讓我們進(jìn)一步了解了谷歌所提的提高內(nèi)容相關(guān)性的算法更新。
SEO熱線:183-6710-6210
新算法簡(jiǎn)介


Google Research在第六屆國(guó)際學(xué)術(shù)會(huì)議上以通過(guò)Twitter發(fā)布了這一新算法研究論文。
論文題目是:正確提出問(wèn)題:強(qiáng)化學(xué)習(xí) 重塑問(wèn)題【Ask The Right Questions: Active Question Reformulation with Reinforcement Learning】
這篇論文討論了一種將查詢問(wèn)題重塑后再提交給搜索引擎的方法。Google其實(shí)已經(jīng)在實(shí)施了查詢問(wèn)題的重塑和提煉,這是方法中的一種。
這一算法的創(chuàng)新在于這是一強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,而且這一算法并不了解排名系統(tǒng)如何工作。他是通過(guò)一個(gè)黑盒子提出問(wèn)題并學(xué)習(xí)。這一算法通過(guò)一個(gè)學(xué)習(xí)系統(tǒng)重塑用戶查詢,向搜索引擎提出諸多相關(guān)問(wèn)題,然后在諸多答案中選擇合適的答案。
該算法如何工作


如下是該研究論文的一個(gè)截圖,它總結(jié)了這個(gè)機(jī)器學(xué)習(xí)算法的工作原理:
用戶提出問(wèn)題,然后該機(jī)器學(xué)習(xí)算法(也就是圖中所示:Agent)將這一問(wèn)題重新表述為多個(gè)問(wèn)題并提交給排序算法。排序算法給出結(jié)果集,機(jī)器學(xué)習(xí)算法在眾多結(jié)果中選擇佳答案呈現(xiàn)給用戶。
該研究論文指出:面對(duì)復(fù)雜的信息需求,人類通過(guò)重塑問(wèn)題,多重研究,整合答案來(lái)規(guī)避不確定性。受到這一啟發(fā),我們通過(guò)Agent(代理)來(lái)執(zhí)行這一過(guò)程,Agent介于用戶和后端QA系統(tǒng)之間,也就是圖中所示:Environment(知識(shí)庫(kù))。
我們把這一代理稱之為AQA,它是一個(gè)積極回答問(wèn)題的策略。AQA旨在通過(guò)向知識(shí)庫(kù)發(fā)送重塑過(guò)的問(wèn)題以大化獲取正確答案的幾率。
Agent通過(guò)提出諸多相關(guān)問(wèn)題和整合諸多答案來(lái)尋找佳答案。Environment(知識(shí)庫(kù))的內(nèi)部對(duì)Agent來(lái)說(shuō)是不可用的,所以它必須使用黑盒來(lái)探測(cè)優(yōu)問(wèn)題字符串。
為何該算法如此重要
該算法讓我們了解了機(jī)器學(xué)習(xí)方法的一種,稱之為強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)算法已經(jīng)被用于機(jī)器學(xué)習(xí)如何玩圍棋,玩電玩,比如Doom(毀滅戰(zhàn)士)。
SEO對(duì)這一特別算法很感興趣,因?yàn)樗梢栽谟脩艉鸵?guī)則排序算法之間插入一個(gè)新的算法,并終做出決策。因此,不同的是排序算法是決定搜索引擎結(jié)果頁(yè)顯示哪些內(nèi)容,這一機(jī)器學(xué)習(xí)算法是決策佳答案的。
這種排名是和SEO論壇傳統(tǒng)上認(rèn)為的網(wǎng)頁(yè)排名是不同的。傳統(tǒng)的理解是,決定搜索結(jié)果中排名1到10的因素有鏈接,網(wǎng)頁(yè)標(biāo)題,錨文本等等。
鏈接對(duì)于排名是一個(gè)很重要的因素。但是,通過(guò)這種算法,鏈接是有助于網(wǎng)頁(yè)的排名,但不再是決定性因素。
這一新算法的工作是決定哪些頁(yè)面適合回答某個(gè)問(wèn)題。
你是否見過(guò)一個(gè)鏈接少的網(wǎng)頁(yè)排名高于那些鏈接多的網(wǎng)頁(yè)?這很可能是在用戶和排序算法之間有一個(gè)決定哪個(gè)網(wǎng)頁(yè)提供佳答案的算法。
排名因素該如何處理?
排名算法不再是網(wǎng)站排名前十的決定性因素,這也是排名因素研究有數(shù)百萬(wàn)結(jié)果卻并不準(zhǔn)確的原因。排名因素研究認(rèn)為排名因素對(duì)搜索結(jié)果前十的網(wǎng)站負(fù)有責(zé)任。
但排名因素并不是總能決定排名前十的因素。因此排名因素研究也并不完全可靠。
雖然這一特定算法目前還沒有被使用,但是已經(jīng)有其他的算法通過(guò)設(shè)置排名算法的結(jié)果來(lái)執(zhí)行類似的功能,并使用不是排名因素的因素來(lái)重新排序SERPs(搜索結(jié)果頁(yè))。
重新排列搜索結(jié)果并不是一個(gè)新想法。微軟在2005年發(fā)布過(guò)一篇學(xué)術(shù)論文,名為:【Improving Web Search Results Using Affinity Graph】(利用關(guān)系圖表來(lái)改善搜索結(jié)果)。這一算法的目的在于為用戶模糊搜索查詢提供更準(zhǔn)確的答案。
這一算法對(duì)SEO有何影響?
這一算法可能會(huì)影響SEO的未來(lái),搜索結(jié)果會(huì)更加強(qiáng)調(diào)滿足用戶的搜索意圖。這一改進(jìn)又稱之為提高內(nèi)容相關(guān)性。因此,當(dāng)Google宣布內(nèi)容相關(guān)性的算法更新時(shí),通過(guò)研究競(jìng)爭(zhēng)排名勝出的網(wǎng)站就會(huì)知道一個(gè)網(wǎng)站丟失排名的佳答案。對(duì)于這類更新,如果只是按照傳統(tǒng)簡(jiǎn)單的研究丟失網(wǎng)頁(yè)排名的網(wǎng)站的內(nèi)容,是很難找到排名改變的原因的。