youngs 2007-3-7 11:25
淺談搜尋引擎運作:資料抓取&頁面排序
[size=12px][size=3][color=black]淺談搜尋引擎運作:資料抓取[/color]
由於全球網頁暴量成長,人工分類不敷所需,全文檢索式的搜尋引擎變成主流。靠著搜尋機器人(Search Bot)自動到全世界抓取網頁,抓回來的網頁上有許多連結,Bot 又自動跟隨這些連結繼續往下抓。
換言之,如果你做了一個網站,但沒有任何其他網站連結到你的網站來,你也沒有主動到搜尋引擎去登錄你的網址,這個網站是永遠無法被搜尋引擎的Bot 找到的,因此你的網站也永遠不會被網友搜尋到。
Bot 搜尋回來的資料放入資料庫中,使用者輸入關鍵字搜尋的時候,搜尋引擎就自動比對資料庫,把網頁上有出現這個字的頁面通通找出來,經過排序之後秀出來。問題是,搜尋引擎如何決定排列順序?
事實上,搜尋引擎會把Bot 找回來的網頁打分數,因此搜尋時分數高的網頁就會排在前面,而排名第10頁以後的網站大概永遠出不了頭。各家搜尋引擎幫網頁打分數的方法不盡相同,但大體方式如下:
[color=black]淺談搜尋引擎運作:頁面排序[/color]
1.該頁面出現那個關鍵字的次數。
比如說有兩個網頁都有提到「電子商務」這四個字,其中一個提到的次數比較多,因此獲得的分數就會比較高些。運用這個方法對搜尋引擎排序的影響較小,因為搜尋引擎也怕網站經營者對網頁「灌水」。
2.網頁標題(Title Tag )是否有出現該關鍵字。
這裡所指標題並不是網頁上的文章標題,而是指HTML語法中的Title Tag 。以上面的例子來說,「電子商務」四個字就必須出現在Title Tag 中,以獲得較高分數。不過此種方式的影響也有限。
3.這個網頁被其他網頁連結的次數與品質。
這是最具決定性的方式,筆者將此種方式戲稱做「投票式的排序方法」。例如,某網頁 A上面有10個連結,其中一個連結到網頁 B,那麼就表示 A投了 B一票,或者說 B得到一分。
當然,網頁 B可能也連結到網頁 C,因此 B也幫 C打分數。由於網路的相連特性,全世界網頁彼此互相打分數,因此每個網頁都有分數。那些被別人連結最多次的網頁,得到最多票,自然就得到最高分。
此外,每個人手上的票份量並不相等。本身分數高的網頁,當它連結到別的網頁時,給對方的分數會越高。假設Google首頁有連結到貴公司網站某頁,該頁面的分數將大大提高,因為Google本身分數很高。
原來要拉高自己網站在搜尋引擎的排名,只要「讓別人連到我的網頁來」以及「找知名度高的網站來連結我」就可以。
[/size][/size]
jeak 2007-3-29 11:52
其實跟 Meta 的內容也很有關係,加在META也不會影響網頁的頁面,算是一個很好的辦法.