※本課程以「實體」及「線上同步」兩種方式並行進行教學,詳情請見下方說明。
※此堂課需要有Python基礎
【上課方式說明】
- 每一堂上課時老師皆會於電腦教室內以「實體」及「線上同步」兩種方式並行進行教學。
- 實體:將在電腦教室上課,教室備有插座,學員亦可自行攜帶筆電操作。
- 線上同步:若學員在課程進行期間因疫情因素或個人特殊情況無法到課,可直接選擇該堂課程以線上同步方式上課。
【線上課程說明】
本課程為線上同步教學,全程使用 Google Meet軟體,請學員確保以下設備
- 任選一種有視訊鏡頭的設備裝置:個人電腦、筆記型電腦、平板電腦。
- 重要課程資訊將在開課前三天透過E-Mail或手機簡訊通知,請務必提供正確的信箱和手機號碼,以確保接收到相關通知。
- 為了上課點名,請同學以「中文姓名本名」為暱稱。
【課程特色】
- 課程以白話的方式解說,由淺入深介紹課程內容
- 將程式開發與執行流程,透過圖表明確表達
- 課前與課後會有一次考試,方便了解學員學習狀態
- 將額外提供課程錄影,學員可於課後複習
- 結合上課內容,定期安排回家作業約2~3次,讓學員有效吸收上課知識與操作
- 回家作業修改會給予同學必要的協助,讓學員免於孤軍奮鬥的窘境
- Line群組即時討論與發問,讓學員可以相互討論
【課程目標及學習成果】
- 教會學員建置Python開發環境部署
- 讓學員學會使用Python抓取網路數據與新聞
- 讓學員學會使用Python抓取動態網頁資料
- 讓學員學會抓取網路資料與應用
【課程大綱】
第一週 |
Python環境安裝與網路爬蟲介紹 |
Python開發環境建置操作、網路爬蟲觀念與網頁基礎語法(HTML、CSS、DOM)介紹 |
第二週 |
認識網路資料格式 |
網站資料格式操作(HTML、JSON、XML、CSV) |
第三週 |
網路封包介紹 |
網路爬蟲請求協定介紹(GET、POST) |
第四週 |
網路封包工具操作 |
網路封包工具操作(Postman、Fiddler) |
第五週 |
網路連線與網頁解析操作 |
Python網路爬蟲套件介紹:requests、BeautifulSoup、PyQuery |
第六週 |
網路資料定位介紹 |
網頁資料定位抓取:CSS Selector、Xpath、正規表示re |
第七週 |
HTML類型網站擷取 |
HTML資料類型網站擷取:期交所期貨每日行情與折線圖、長條圖繪製 |
第八週 |
JSON類型網站擷取 |
JSON資料類型網站擷取:鉅亨網頭條新聞、股票代碼與文字雲繪製 |
第九週 |
XML類型網站擷取 |
XML資料類型網站擷取:7-11門市抓取與地圖繪製 |
第十週 |
CSV類型網站擷取 |
CSV資料類型網站擷取:期交所Put/Call ratio抓取與圖表繪製 |
第十一週 |
進階網站擷取1 |
進階網站擷取1:鉅亨網股價創新高、Stock-AI |
第十二週 |
進階網站擷取2 |
進階網站擷取2:公開資訊觀測站重大訊息、MoneyDJ頭條新聞 |
【研習期滿】
結業後,可自行上網下載本校進修推廣學院非學分班修讀證明。
下載步驟 : https://www.sce.ntnu.edu.tw/home/news/detail.php?20201208-173541
(若需申請繳費收據,請於結業前來電,並留下可收取掛號信的地址,以確保收件,謝謝!)