yellowDog
2024-07-11 84049dc62834c9da6ead0f06644a32e9ebc7c0e8
修改依赖项
3 files modified
19 ■■■■■ changed files
config/base_config.py 14 ●●●●● patch | view | raw | blame | history
main.py 3 ●●●● patch | view | raw | blame | history
requirements.txt 2 ●●● patch | view | raw | blame | history
config/base_config.py
@@ -1,5 +1,5 @@
# 基础配置
PLATFORM = "xhs"
PLATFORM = "dy"
KEYWORDS = "python,golang"
LOGIN_TYPE = "qrcode"  # qrcode or phone or cookie
COOKIES = ""
@@ -46,7 +46,7 @@
ENABLE_GET_IMAGES = False
# 是否开启爬评论模式, 默认不开启爬评论
ENABLE_GET_COMMENTS = False
ENABLE_GET_COMMENTS = True
# 是否开启爬二级评论模式, 默认不开启爬二级评论, 目前仅支持 xhs, bilibili
# 老版本项目使用了 db, 则需参考 schema/tables.sql line 287 增加表字段
@@ -62,8 +62,12 @@
# 指定抖音需要爬取的ID列表
DY_SPECIFIED_ID_LIST = [
    "7280854932641664319",
    "7202432992642387233"
    "7383967087674281228",
    '7334007011404729612',
    '7378373529244306725',
    '7280489551796145466',
    '7253441575030738234',
    '7389577992764280114'
    # ........................
]
@@ -95,7 +99,7 @@
# 指定Dy创作者ID列表(sec_id)
DY_CREATOR_ID_LIST = [
    "MS4wLjABAAAATJPY7LAlaa5X-c8uNdWkvz0jUGgpw4eeXIwu_8BhvqE",
    "MS4wLjABAAAA_AjUSCZATiI47vnge919AQ7GTdrxTZTtQV0FGbTaroc",
    # ........................
]
main.py
@@ -28,6 +28,7 @@
            raise ValueError("Invalid Media Platform Currently only supported xhs or dy or ks or bili ...")
        return crawler_class()
async def main():
    # parse cmd
    await cmd_arg.parse_cmd()
@@ -38,7 +39,7 @@
    crawler = CrawlerFactory.create_crawler(platform=config.PLATFORM)
    await crawler.start()
    if config.SAVE_DATA_OPTION == "db":
        await db.close()
requirements.txt
@@ -13,4 +13,4 @@
python-dotenv==1.0.1
jieba==0.42.1
wordcloud==1.9.3
matplotlib==3.9.0
matplotlib