
圖片來源:圖蟲創意
因為QA模塊信息太重要,所以寫個QA自動爬取程序,在瀏覽器中爬取競品QA。
部分數據效果圖如下。
圖片來源:乃超老師
本文分4個部分:
1. QA的作用
2. 使用步驟
3. 觸類旁通思路
4. 工具代碼
一、QA的作用
1. 從競品中找到買家關注的點,進行產品優化及問題規避
2. 弱客服情況下,盡可能從QA層面解答買家疑問,提高轉化率
二、使用步驟
1. 谷歌瀏覽器中安裝web scraper插件
2. 導入文章末尾代碼
3. 設置需爬取的鏈接
https://www.amazon.com/ask/questions/asin/愛森跨境/[1-n]?sort=SUBMIT_DATE
* 將‘愛森跨境’換成想爬的ASIN
* 將‘[1-n]’中的n換成想爬取的頁數
4. 點擊爬取按鈕、下載表格
圖片來源:乃超老師
三、觸類旁通思路
爬取思路很簡單,針對QA模塊,當然能收集到的數據有很多,可以按思路自定義自己的爬取規則
1. 分析網頁結構,打開QA模塊主頁
https://www.amazon.com/ask/questions/asin/B08D6CLGLH/1?sort=SUBMIT_DATE
圖片來源:亞馬遜平臺截圖
根據網頁分析,得出三點結論:
* 鏈接拼湊結果為 公共部分+ASIN+頁序號+排序方式
* 排序方式有兩種 Most Helpful first 和 Newest first。對應字段值為SUBMIT_DATE、HELPFUL
* 遇到多條回答的問題,無法展開,只能跳到問答詳情頁
因此,根據流程,要爬取一個問題的所有回答,則必須抓取詳情頁數據。問答詳情頁分析如下:
圖片來源:亞馬遜平臺截圖
由圖可知,一個問答對應一個問答ID,問答詳情頁面也是由該ID拼接而成。所以只需打開不同問題拿到對應問題下的所有回答就好。
加入我們獲取更多純干貨內容,教你如何用通俗代碼解決平常數據收集和分析問題。
(來源:乃超老師)
以上內容屬作者個人觀點,不代表雨果跨境立場!本文經原作者授權轉載,轉載需經原作者授權同意。?