1. <tt id="5hhch"><source id="5hhch"></source></tt>
    1. <xmp id="5hhch"></xmp>

  2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

    <rp id="5hhch"></rp>
        <dfn id="5hhch"></dfn>

      1. 提高網(wǎng)站在Google中的排名二)

        • 相關(guān)推薦

        提高網(wǎng)站在Google中的排名(二)

        提高網(wǎng)站在Google中的排名(二) 
         
         
          
        如何突出關(guān)鍵詞:面向主題(Theme)的關(guān)鍵詞匹配
         Theme Engine正在逐步超過PR,成為結(jié)果排序中更主要的因素,可以比較一下以下現(xiàn)象: 
        為什么查“新聞”,“汽車”之類的文字,各種門戶網(wǎng)站的首頁不在第一位?要知道他們的頁面中都有相應(yīng)頻道的鏈接文字的 
        一篇新聞頁面中,搜索引擎如何不通過模板匹配,自動將新聞的主體和頁面中的頁頭,欄目導(dǎo)航條,頁尾等部分的內(nèi)容區(qū)分開的? 
        其實(shí)以上問題都可以歸結(jié)為網(wǎng)頁內(nèi)容摘要的提取策略和關(guān)鍵詞在其中的命中:
        首先將能夠描述一個頁面內(nèi)容的分成以下幾種類型:

        鏈入文字描述:inbound link text
        http://www.searchenginedictionary.com/terms-inbound-link.shtml

        HTML頁面標(biāo)題:title 好標(biāo)題一般會將頁面中最重要的關(guān)鍵詞放在最前面,比如:ABC-10型吸塵器 - XX家電城 
        HTML內(nèi)容主體:content text 
        鏈出文字:outbound link text

        如果按照以下規(guī)則:
        一個頁面中關(guān)鍵詞命中權(quán)重:鏈入文字 > HTML標(biāo)題文字 > HTML頁面主體內(nèi)容 >> 出鏈文字,以上現(xiàn)象就比較好解釋了。
        鏈入文字是頁面上看不見的,但鏈入文字對被鏈接頁面有巨大的作用:在現(xiàn)代搜索引擎在關(guān)鍵詞匹配的過程中,匹配的過程不只看當(dāng)前頁面的內(nèi)容摘要:很大程度上,不只看這個網(wǎng)頁自己說自己有什么內(nèi)容,還要看別人如何鏈接時,如何描述你的網(wǎng)站別人怎么稱呼你,比你自己說自己更重要。。
        比如查:“世界衛(wèi)生組織”,返回結(jié)果中有http://www.who.int/ 而這個頁面中是沒有中文的,之所以能匹配上,是因?yàn)楹芏噫溄铀闹形木W(wǎng)站使用了:<a >世界衛(wèi)生組織</a>,所以,這個頁面中不存在的中文關(guān)鍵詞也成為了頁面摘要的一部分。這樣一想,就可以知道鏈出鏈接的文字其實(shí)是為被鏈接的子頻道首頁或者內(nèi)容詳情頁服務(wù)的。對自身頁面的關(guān)鍵詞密度只有負(fù)面的影響,這也是Google建議一個頁面中鏈接不要超過100個的原因:他根本不索引100個鏈接以后的內(nèi)容。按照以上規(guī)則,搜索引擎將一篇新聞詳情頁中的新聞內(nèi)容提取出來就是把頁面上所有帶HTTP鏈接的文字都去掉,就是新聞的內(nèi)容部分了,更精確一些可以通過取最長文本段落等策略實(shí)現(xiàn);而很多網(wǎng)站首頁或頻道首頁中幾乎全部都是鏈接,經(jīng)過搜索引擎分析的結(jié)果就是:什么內(nèi)容也沒有,能夠被命中的關(guān)鍵詞僅僅是別人鏈接你用的“網(wǎng)站首頁”和頻道標(biāo)題Title中的站點(diǎn)名稱等的幾個關(guān)鍵詞,而頁面中其他的文字則遠(yuǎn)遠(yuǎn)不如相應(yīng)子頻道和具體內(nèi)容頁面的匹配度高,而搜索引擎能夠通過以上規(guī)則,讓用戶更快的直接定位到有具體內(nèi)容的內(nèi)容詳情頁面。因此希望通過一個首頁,盡可能多的命中所有希望推廣的關(guān)鍵詞是不可能的。讓網(wǎng)頁盡可能多的進(jìn)入搜索引擎的索引,然后把握好整個網(wǎng)站的主題風(fēng)格是非常重要的,讓網(wǎng)站的主題關(guān)鍵詞能夠比較均勻的按照金字塔模式分布到網(wǎng)站中可以參考:網(wǎng)站的主題金字塔設(shè)計(jì)          網(wǎng)站名稱(用戶通過1-2個抽象關(guān)鍵詞)
                 /       \
            子頻道1   子頻道2 (用戶通過2-3個關(guān)鍵詞命中)
           /    \      /    \
        產(chǎn)品1  產(chǎn)品2 文章1 文章2 (用戶通過3-4個關(guān)鍵詞命中:這種用戶最有價(jià)值)


        不要空著標(biāo)題:空著<title></title>無異于浪費(fèi)了最有價(jià)值的一塊陣地;
        傳統(tǒng)的頁面中,HTML頁面中會有類似以下的隱含信息,用于說明當(dāng)前網(wǎng)頁的主要內(nèi)容關(guān)鍵字:
        <header>
            <meta name="keyword" content="mp3 download music...">
        </header>
        后來由于這種人工添加關(guān)鍵詞的方式被濫用,大量網(wǎng)頁中為了提高被搜索引擎命中的概率,經(jīng)常添加一些和實(shí)際網(wǎng)頁內(nèi)容無關(guān)的熱門關(guān)鍵比如:“music mp3 download”等,所以新一代的搜索引擎已經(jīng)不再關(guān)心頁面頭文件中的人工meta keyword聲明,而頁面標(biāo)題在搜索引擎的關(guān)鍵詞的命中命中過程中往往有著更高的比重,如果一個關(guān)鍵詞在標(biāo)題中命中會比在頁面中命中有更高的得分,從而在相應(yīng)的搜索結(jié)果排名中更靠前。 

         
        標(biāo)題長度和內(nèi)容:不要過長,一般在40個字符以內(nèi),并充分突出關(guān)鍵詞的比重;
        如果更長的標(biāo)題搜索引擎一般會忽略掉,所以要盡可能將主要關(guān)鍵詞放在標(biāo)題靠前的位置。省略掉不必要的形容詞吧,畢竟用戶主要通過名詞來找到需要的內(nèi)容。標(biāo)題內(nèi)容:盡量用一些別人可以通過關(guān)鍵詞找到的字眼(也別太過頭,如果標(biāo)題中的字眼超過1半內(nèi)容中都沒有,有可能被搜索引擎排除出索引),因此基于web日志中來自其他搜索引擎的關(guān)鍵詞查詢統(tǒng)計(jì)非常必要。 
        如果網(wǎng)頁很多的話,盡量使用不同的網(wǎng)頁標(biāo)題,爭取讓自己網(wǎng)站的內(nèi)容更多的進(jìn)入搜索引擎索引范圍;
        因?yàn)樗阉饕鏁鶕?jù)頁面內(nèi)容的相似度把一些內(nèi)容當(dāng)成重復(fù)頁面排除出索引范圍;
        http://www.chedong.com/phpMan.php是我的網(wǎng)站上的一個小應(yīng)用:一個web界面的unix命令手冊(man page),在以前的設(shè)計(jì)中所有動態(tài)頁面使用的都是同樣的標(biāo)題:"phpMan: man page /perldoc /info page web interface" ,Google索引了大約3000多個頁面,后來我將頁面標(biāo)題改成了"phpMan:  [命令名]"這樣的格式,比如:"phpMan: ls",這樣大部分動態(tài)頁面的標(biāo)題就都不一樣了,一個月后Google從這個頁面入口索引了大約6000個頁面。因此,如果網(wǎng)站中很多網(wǎng)頁都使用相同的標(biāo)題,比如:“新聞頻道”,“論壇”,這些頁面中很大一部分就會被排重機(jī)制忽略掉。 
        除了<title></title>外,還可以用<h1></h1>標(biāo)題行突出內(nèi)容主題,加強(qiáng)標(biāo)題的效果;
        在我的網(wǎng)站設(shè)計(jì)中:我會把用<h1>[標(biāo)題]</h1>這樣的模板把標(biāo)題突出顯示,而不是通過改變字體的方式突出標(biāo)題。 
        其他網(wǎng)站設(shè)計(jì)提示
        靜態(tài)鏈接:Blog網(wǎng)站另外一個優(yōu)勢在于其網(wǎng)頁是靜態(tài)鏈接:動態(tài)網(wǎng)頁占到整個互聯(lián)網(wǎng)內(nèi)容的90%以上。各個搜索引擎其實(shí)能夠表現(xiàn)的都只不過是互聯(lián)網(wǎng)的冰山一角(3-5%),不同的只是誰讓優(yōu)質(zhì)網(wǎng)頁排名靠前的策略更優(yōu)秀而已:大部分搜索引擎都認(rèn)為靜態(tài)鏈接的網(wǎng)頁是優(yōu)質(zhì)網(wǎng)頁,Google在優(yōu)先抓取索引的網(wǎng)頁中70%以上是不帶參數(shù)鏈接的靜態(tài)網(wǎng)頁。而且即使同樣的內(nèi)容,靜態(tài)網(wǎng)頁也會比動態(tài)網(wǎng)頁權(quán)重高:很容易理解:query?a=1&b=2這樣的鏈接由于參數(shù)順序顛倒的query?b=2&a=1完全相同。盡量使用靜態(tài)網(wǎng)頁:目前能夠動態(tài)網(wǎng)頁進(jìn)行全面的索引還比較難,而即使是Google也更不會索引所有的內(nèi)容,因此很少會對參數(shù)超過2個的動態(tài)網(wǎng)頁進(jìn)行進(jìn)一步的抓取和分析。以下是一個phpBB論壇頁面返回的HTTP頭信息: 
        HTTP/1.1 200 OK Date: Wed, 28 Jan 2004 12:58:54 GMT Server: Apache/1.3.29 (Unix) mod_gzip/1.3.26.1a PHP/4.3.4 X-Powered-By: PHP/4.3.4 Set-Cookie: phpBB_data=a%3A0%3A%7B%7D; expires=Thu, 27-Jan-2005 12:58:54 GMT; path=/; Set-Cookie: phpBB_sid=09f67a83ee108ecbf11e35bb6f36fcec; path=/; Content-Encoding: gzip Cache-Control: private, pre-check=0, post-check=0, max-age=0 Expires: 0 Pragma: no-cache Connection: close Content-Type: text/html 

        為了避免隱私問題:Googlebot可以通過對頁面http header中的session id和session cookie進(jìn)行一些甄別,這樣很多需要認(rèn)證信息的論壇內(nèi)容就無法進(jìn)入索引了。
        總體上說Google喜歡新的,靜態(tài)的內(nèi)容。因此無論從效率上講還是方便搜索引擎收錄:使用內(nèi)容發(fā)布系統(tǒng)將網(wǎng)站內(nèi)容發(fā)布成靜態(tài)網(wǎng)頁都是非常必要的,從某種程度上說google friendly = anonymous cache friendly。
        比如http://www.chedong.com/phpMan.php/man/intro/3
        http://www.chedong.com/phpMan.php?mode=man&;parameter=intro§ion=3這樣的鏈接更容易進(jìn)入搜索引擎的索引。而且在URL中的命中也能突出關(guān)鍵詞。 
        能夠進(jìn)入Google索引的頁面數(shù)量越多越好。用類似以下的腳本可以統(tǒng)計(jì)自己的網(wǎng)站被搜索引擎索引的情況。 

        #!/bin/sh YESTERDAY=`date -d yesterday +%Y%m%d` # for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d` LOG_FILE='/home/apache/logs/access_log' grep -i Googlebot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt grep -i baiduspider $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.baiduspider.txt grep -i msnbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.msnbot.txt grep -i inktomi $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.inktomi.txt grep -i openbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.openbot.txt 

        網(wǎng)站目錄結(jié)構(gòu)要扁平,因?yàn)槊可钜患壞夸,PAGERANK降低1-2個檔次。假設(shè)首頁是3,其子可能目錄就是1了,更深可能就無法列入評級范圍了。

        表現(xiàn)和內(nèi)容的分離:“綠色”網(wǎng)頁
        網(wǎng)頁中的javascript和css盡可能和網(wǎng)頁分離,一方面提高代碼重用度(也方便頁面緩存),另外一方面,由于有效內(nèi)容占網(wǎng)頁長度的百分比高,也能提高相關(guān)關(guān)鍵詞在頁面中的比重也增加了?傊,應(yīng)該鼓勵遵循w3c的規(guī)范,使用更規(guī)范的XHTML和XML作為顯示格式便于內(nèi)容更長時間的保存。 
        讓所有的頁面都有能夠快速入口:站點(diǎn)地圖,方便網(wǎng)頁爬蟲(spider)快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。如果首頁就是用Flash或圖片進(jìn)入的話,無異于將搜索引擎拒之門外,除了UI設(shè)計(jì)的用戶友好外,spider friendly也是非常重要的。 
        保持網(wǎng)站自身的健康:經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。 
        保持網(wǎng)頁內(nèi)容/鏈接的穩(wěn)定性和持久性:在搜索引擎索引中網(wǎng)頁存在的歷史也是一個比較重要的因素,而且歷史比較久的網(wǎng)頁被鏈接的幾率越高。為了保證自己網(wǎng)頁能夠被比較持久的被其他網(wǎng)站的頁面引用,如果自己網(wǎng)頁中有鏈接更新時,最好能保留舊的頁面并做好鏈接轉(zhuǎn)向,以保持內(nèi)容的連續(xù)性。要知道,把一個網(wǎng)站和內(nèi)容在搜索引擎中的排名“培養(yǎng)”的很高是一件非常不容易的事情,誰都不希望好不容易自己的內(nèi)容被別人找到了,點(diǎn)擊卻是“404 頁面不存在”吧,因此站點(diǎn)管理員對自身站點(diǎn)error.log的分析也是非常必要的。 
        文件類型因素:Google有對PDF, Word(Power Point, Excel), PS文檔的索引能力,由于這種文檔的內(nèi)容比一般的HTML經(jīng)過了更多的整理,學(xué)術(shù)價(jià)值一般比較高,所以這些類型的文檔天生就比一般的HTML類型的文檔 PageRank要高。因此,對于比較重要的文檔:技術(shù)白皮書,F(xiàn)AQ,安裝文檔等建議使用PDF PS等高級格式存取,這樣在搜索結(jié)果中也能獲得比較靠前的位置。 
        常常能發(fā)現(xiàn)門戶站點(diǎn)的一條新聞往往比其他站點(diǎn)的首頁排名還要靠前。因此一個站點(diǎn)總體PageRank提高了以后,往往自身一些并不重要的內(nèi)容也會被同那些高PageRank的內(nèi)容一起帶入被搜索引擎優(yōu)先查詢的列表中。這樣經(jīng)常造成很多大的開發(fā)站點(diǎn)的郵件列表歸檔往往比其他站點(diǎn)的首頁P(yáng)ageRank還要高。

        【提高網(wǎng)站在Google中的排名二)】相關(guān)文章:

        高校舞蹈教學(xué)中提高學(xué)生情感表現(xiàn)力的策略分析,舞蹈教學(xué)中如何提高學(xué)生的情感表達(dá)08-13

        提高數(shù)學(xué)教學(xué)論文11-04

        淺談會計(jì)在提高企業(yè)經(jīng)濟(jì)效益中的作用論文(精選10篇)10-11

        淺談二胡在戲曲音樂中的作用(精選5篇)04-13

        提高歷史課堂的教學(xué)效率的方法03-02

        淺談如何提高鋸削技能論文03-22

        閱讀提高學(xué)生文學(xué)素養(yǎng)論文(精選9篇)07-26

        如何提高旅游服務(wù)質(zhì)量論文03-30

        淺談提高物理教學(xué)質(zhì)量的措施論文03-04

        淺談?wù)Z文課堂教學(xué)效率的提高03-08

        国产高潮无套免费视频_久久九九兔免费精品6_99精品热6080YY久久_国产91久久久久久无码

        1. <tt id="5hhch"><source id="5hhch"></source></tt>
          1. <xmp id="5hhch"></xmp>

        2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

          <rp id="5hhch"></rp>
              <dfn id="5hhch"></dfn>