你是否想學如何做出一個網路爬蟲,但只要一看到一長串的程式碼就覺得頭昏眼花呢?
你是不是學會做網路爬蟲,但遇到有防爬蟲的網站,就無法順利爬取網站了?
想學破解防爬機制,又被一堆網路技術專有的名詞搞的一頭霧水呢?
今天的影片,將為你介紹微軟提供的免費軟體
Power Automate ,讓你輕鬆的做出自已想要的爬蟲程式。
甚至連Google reCAPTCHA驗證碼也能不用寫程式就輕鬆的破解驗證碼,影片最後有展示,請一定要把影片看到最後哦
片頭
HI!歡迎來到Excel 金融分析,從零打造量化交易
系統的頻道,我是豐島(Excel股票分析的站長)
如果你也喜歡這樣的內容,記得訂閱我的頻道,打開旁邊的小鈴鐺,這樣子你就不會錯過任何新影片通知了
跟各位朋友分享一下,我現在有提供金融分析軟體專案開發的服務,如果想要委託我開發程式的朋友,可以到HEV資訊工作室網站與我取得聯繫,網址我會放在下方的資訊欄,或是直接GOOGLE “HEV資訊工作室”也可以。
最近我在YouTube上,看到了有人在分享用微軟的Power Automate這個軟體做出網路爬蟲的功能,我去GOOGLE了一下,才發現這是微軟提供的一個商用軟體,而且分成雲端及桌機二個版本,雲端的一些功能是需要付費的,但桌機版基本上所有功能都可以免費使用,除非你想要跟雲端版的做連結,由雲端去觸發桌面版的流程,才需要付費。
Power Automate主要是以Low Code (低代碼)的方式編程,對於不懂程式的朋友相當的友善,而且完全是繁體中文介面,編程的過程,也只需要用滑鼠拖拉選項就可以了,在操作上完全沒有任何障礙。
如果是Windows 11 的用戶,可以在開始-程式集那找到power automate,Windows 10 的用戶,我們可以用GOOGLE搜尋power automate desktop,進入power automate 電腦版的網頁,按免費開始後找到下載連結下載並安裝程式。
安裝好之後只要登入個人版的微軟帳號就可以開始使用了。
今天我們先用下載上市櫃日收盤資料的CSV來做網路爬蟲的範例
先打開證交所網站,交易資訊=>每日收盤行情,分類項目選全部(不含權證….)=>查詢,往下拉就可以看到有所有個股的資訊了,接下來我們在CSV下載的按鍵上按右鍵,復製連結網址,就可以取得當日的下載連結,到Power Automate建立一個新流程,在瀏覽器自動化的選項裡,選擇啟動新的Chrome,按住滑鼠左鍵拉到編程窗格,在初始URL按右鍵貼上剛剛復製的網址,再把網址內date=的參數: 20220511刪掉,這樣預設就會下載每天最新的檔案了,再按儲存,再來選流程控制下的等候,拉過去,參數填入5秒,下一步我們打開櫃買中心的網站,上櫃=>盤後資訊=>每日收盤行情,選股下拉選到所有證券(不含權證…),左鍵按一下另存CSV,檔案下載下來後,我們打開Chrome的選項,選下載,在剛才下載的檔案按一下左鍵,就可以看到真實的下載網址了,按一下復製,回到Power Automate,瀏覽器自動化的前往網頁,拉過來後在URL貼上,並把日期的參數刪掉,儲存,再把關閉網頁瀏覽器拉過來,這樣子就完成了,我們先把剛剛下載的檔案刪掉,再按一下執行,這樣子只要拖拉四個步驟就可以完成一個簡單的爬蟲了,我用VBA至少要寫幾十行的程式才能做到,就算用python也要10幾行以上才能做的到,而且遇到一些防爬蟲會檢測是不是真人使用瀏覽器的網站,跟本不用再多寫任何程式碼去破解,因為Power Automate就是以真人的操作行為來編程的,所以大部份的網站都可以直接下載,而且用Power Automate來做爬蟲,也不會對於Server端造成負擔。
這個範例只是簡單的應用,更深入的應用甚至可以破解Google的reCAPTCHA驗證碼,接下來的影片就是我用Power Automate成功破解了驗證碼爬取上櫃分點明細的展示。
每一檔股票下載完,會自動下載下一檔股票,等一下會遇到Google的reCAPTCHA驗證碼,……
驗證碼出現了,自動轉成語音,並成功通過驗證碼,繼續下載分點明細。
只要流程開啟後,就可以不用管它,去做自已的事情,回來後所有上櫃股票的分點明細都幫我下載好並且歸檔到指定的資料夾內,這樣子是不是很方便呢?
如果對於Power Automate更進階的應用有興趣的話,也請留言讓我知道,如果人數多的話,我會多分享一些相關的影片,那我們下次見囉!!
片尾
張貼留言