跳到主要內容

網址的中文不是中文,更不是 UTF-8

 

網址的中文不是中文,這個觀念一直是我「網址中不一定要放中文」的核心邏輯,尤其在搜尋引擎中你搜尋的關鍵字跟網址中的中文編碼就不一樣了
中文在各種編碼的呈現
根據 W3C 的定義

URL encoding converts characters into a format that can be transmitted over the Internet. URLs can only be sent over the Internet using the ASCII character-set. Since URLs often contain characters outside the ASCII set, the URL has to be converted into a valid ASCII format. URL encoding replaces unsafe ASCII characters with a "%" followed by two hexadecimal digits. URLs cannot contain spaces. URL encoding normally replaces a space with a plus (+) sign or with %20.[1]

然後最近已經看到多次 SEO 相關文章講到網址的時候說:網址是 UTF-8 的格式。這讓我頭很痛,網址(嚴格來說 URI)的中文不是中文,也不是 UTF-8 編碼 是 UTF-8 編碼(而且還要是 16 進位編碼)過後,再經過 url encoding 的結果[2]

另外 URL encoding 的解碼,是依據「網頁編碼」是什麼還會有所變化,雖然這年頭 big5 跟 unicode 的網頁已經屬於稀世珍物,但如果是「中文」來說,網址的呈現是 

  • UTF-8 的網頁是 %e4%b8%ad%e6%96%87 
  • Big5 的網頁是 %a4%a4%a4%e5 
  • unicode 的網頁是 %u4e2d%u6587 
為什麼要強調 URI (也可以說 URL 啦)呢?因為「網域的中文也不是中文」而那更是另外一種編碼了...

參考資料

  1. https://www.w3schools.com/tags/ref_urlencode.ASP 
  2. https://zh.wikipedia.org/zh-tw/%E7%99%BE%E5%88%86%E5%8F%B7%E7%BC%96%E7%A0%81 

留言

這個網誌中的熱門文章

2022年了, Google 都建議你不要做 sitemap 了:重新認識 SEO 中的 Sitemap

首先,如果我跟你說你的網站 其實可能「不」需要 Sitemap ,我想這句話會顛覆多數人的認知,但實際上這句話卻是 Google 官方文件白紙黑字寫出來的[1],以下是可能「不」需要 Sitemap 的情況: 網站規模很「小」:所謂的規模很「小」,指的是網站的 網頁數不超過 500 個  (以您認為有需要納入搜尋結果的網頁為準)。 網站內部的連結完善:這表示 Google 可以透過首頁的連結找出網站上所有的重要網頁。 要顯示在搜尋結果中的媒體檔案 (影片、圖片) 或新聞網頁數量不多:Sitemap 可協助 Google 在您的網站上找出影片和圖片檔或新聞報導,並加以解讀。如果您不需要讓這些內容出現在圖片、影片或新聞搜尋結果中,可能就不需要 Sitemap。 其實絕大多數各位手邊的網站,真的有需要納入搜尋結果的網頁,各位請自行捫心自問一下:真的有超過 500 頁嗎?如果是電商,你的商品數真的有那麼多嗎?當然這是極端的說法,因為我相信大家都會覺得說:那有一天我超過 500 個怎麼辦,或是我是新網站怎麼辦?

SEO建議做在QDM內建還是WordPress上比較好?電商內容行銷實務分享

那天有一位社團成員匿名發問:SEO建議做在QDM內建還是WordPress上比較好?他的問題是: 我們家使用QDM系統,有意願做SEO,之前因為QDM內建的部落格版面老闆覺得醜,所以另外用Wordpress自建了一個部落格目前兩邊都是有文章的,想問大家這個情況,SEO建議做在QDM內建的還是Wordpress上比較好呢? 其實他的問題是:如果我想透過內容行銷或產生文章來做好 SEO ,那我應該用電商平台內建的部落格功能,還是另外架設一個外部網站(如用 WordPress)來放內容呢?這個問題嚴格來說是老生常談,但在回答這個問題之前,我們先複習一下先前 台灣電商開店平台 SEO 能力大解析 中,電商平台 有沒有部落格功能這一評分標準 ,其實就會跟我們今天的解答有關係。

用 ChatGPT 來做 SEO 的基礎內容建設是否能被搜尋引擎接受?實驗不到一個月我有了答案

身為一個 SEOer ,看到任何有趣的新東西,自然就是在思考:這個東西對 SEO 是不是有幫助?就像當年寫部落格是為了外鏈自建跟內容生成, Facebook 剛開始的年代,上面的外鏈全部是 DoFollow(具有價值的連結),所以我玩起了 FB 。但這麼多年來, ChatGPT 真的是我花最大量心思去投入的工具,因為他對我的 SEO 策略真的太有幫助了,但這些想法都是假設,於是我自己展開了實驗。我利用 ChatGPT 以及其他延伸的工具來產出「相對可能沒那麼 100% 專業,但應該有 80 分水準以上,適合普羅大眾觀看」的內容,大概步驟如下: