跳到主要內容

發表文章

目前顯示的是 8月, 2014的文章

連勝文官網到今天還有哪些 SEO 問題?(20140825)

連勝文官網 到現在還有什麼 SEO 上的問題嘛?  寫完前一篇,發現職業病發作,不得不來寫一下:到現在 連勝文官網 基礎 SEO 都還沒有做好是哪裡有問題: 1. html lang="en" 這段是在宣告說,接下來的 html 內容主要語系是哪個語言。目前的宣告是 "en" 。這會有什麼影響呢?這主要是會影響搜尋引擎對於 當地內容 重要的排序,尤其是 Yahoo ,他的搜尋結果預設是「台灣地區的網頁」,這影響很大啊!其中的內容我們在: 跨國網站所屬國家不會出現搜尋結果問題的解決   細論國家域名(Country-Specific Domain,cctld ) 與SEO的影響:.com還是.com.tw? 裡面都有提到搜尋引擎是如何判斷網頁語系的。 2. meta keywords 還在撰寫 老實說,這是一個非常不必須的參數,到現在還在寫這個的, SEO 知識大概落伍四年以上,真的 Google 早就說『我們不看 meta keywords了』, Bing 也只是當做 spam signal 。當然,要編我是不反對,但是還有許多早就被淘汰的 SEO 參數,你可以參考 SEO修身篇 | 五個最常誤用的Meta值rds 這篇文章。 3. 沒有看到 Open Graph Protocol OK, 我承認這算是一個有點挑剔的揪錯。但是在社群發達的今日,如何正確的控制自己的網站在社群網站上被分享時,能夠呈現理想的表現,以增加看到分享訪客的回流率,更增加網站的 Social Signal 這是重要的 SEO 工作。至於什麼是Open Graph Protocol 及 Social Signal?請看 網站優化的未來 – 社群化篇 。 4. 已經宣告是 HTML5 了,還在用 div當容器,而且過度使用 h1 其實在 HTML5 的世界裡面,對於網站的語義化已經相當方便。過去我們可能需要 div id="header" 來告訴搜尋引擎說這是版頭的部分,現在在 HTML5 的世界裡面,我們只需要用 header 就可完成。而且在網站的程式碼裡面,還多次重複使用了 h1 標籤。在 HTML5 裡面重複使用 h1 並不是不行,但是他必須配合其他的語義標籤來使用(如 se

從連勝文官網看搜尋引擎怎麼收錄你的網站

8/25『連勝文官網』的搜尋結果 是說 SEO 要做的事情有好多,其中有一項,外面的很多教學都告訴你說一定要做,那就是 robots.txt 的建置。我直接跳結論:我已經很多年都不特別設定 robots.txt ,更多時間我是直接寫入 .htaccess 或是用其他方式限制爬蟲權限,因為 Google 的爬蟲常常不理會 robots.txt 的設定啊!另外一個理由,把一些重要的資料夾寫在 robots.txt 中,根本就是在告訴一些人: 您好,我的重要資料夾都寫在 Disallow 底下唷 ! 一、 robots.txt disallow 及 Allow 有順序性? 最近這個 robots.txt 因為連勝文競選官網的原因被 新聞報導 說『 官方網站正式上線1個多小時,在搜尋引擎上還是找不到網站位置 』,媒體不專業沒關係,當然就引起了一番討論,幾位『專家』(如 他 跟 她 )的討論,沒錯在 robots.txt 裡面的 disallow 跟 allow 是有順序性的,在官方的 說明文檔 當中也舉了範例: 所以一開始把 DisAllow : / 寫在最前面真的很傷,但這其實不是我們今天要聊的主要故事 二、Googlebot 有機會不理會 robots.txt? 這件事是真的,在過去 SEO 的經驗中,有幾次 Google 並不理會 robots.txt disallow 的內容,在跟幾個前輩討論求教的時候,其中 連啟佑 前輩有點出 Google 其實有一段特別的 說明 : 雖然 Google 不會對 robots.txt 所封鎖的內容進行檢索或建立索引,但如果我們在網路上的其他網頁中發現封鎖網址的資訊,仍然會建立這些資訊的索引。因此,網頁網址以及其他可能的公開資訊 (例如網站連結中的錨點文字) 仍然會出現在 Google 搜尋結果中。如要完全避免這種情形,請使用 robots.txt 輔以其他封鎖網址方法,例如使用密碼保護伺服器上的檔案或在 HTML 中插入中繼標記。 其實從 Google 本身的建議來說,如果要加速或是讓 Bot 更加了解你的網站的時候,除了內容的建設之外,你還必須多在外部加強連結的導入,可以讓 Googlebot 更加了解你的網站。所以如果真的有需要不希望 Google 來爬的內容,真的不要隨便放上