Python 網路爬蟲 Web Crawler 教學 – AJAX / XHR 網站技術分析實務 By 彭彭

喜歡彭彭的教學影片嗎?點擊「加入」按紐取得更多會員服務哦。
加入會員:https://www.youtube.com/channel/UCguZS-y7codLSt6vpkVdnKg/join

建議先學習基本的網路爬蟲程式,請參考另外一份影片:

0. 最終目標:抓取 Medium.COM 網站的文章列表資料

1. 什麼是 AJAX 技術
1.1 網頁前端 JavaScript 的技術
1.2 網頁載入後持續和伺服器互動的技術

2. 分析網站運作模式
2.1 仔細觀察網站資料的載入時間點
2.2 檢查原始碼是否包含網站資料

3. 找到正確的資料網址
3.1 利用 Chrome 的開發人員工具
3.2 利用 Network 工具觀察 AJAX / XHR 的運作
3.3 找出資料來源網址,觀察資料格式

4. 實務操作
4.1 觀察 medium.com 的網站運作
4.2 找到 medium.com 的首頁文章標題資料網址
4.3 利用爬蟲程式,連線抓取

——————-

更多學習資訊,請到彭彭的課程網站:
https://training.pada-x.com/

Leave your comment

Your email address will not be published. Required fields are marked *