python dev 技巧汇总
request 成功获得selecetor与否后需要 parsel库解析xpath时候防止出现nonetype办法 from parsel import Selector # 假设你已经有了一个Selector对象 selector = Selector(text=your_html_conten
git使用
配置 # 安装并查看git版本信息 apt update && apt-get install git && git --version # macOS brew install git # 配置 用户信息并查看配置信息 git config --global user.name "emix19
ubuntu 日常维护操作命令
文件操作 文件夹树 tree -I '.*|__*' >> tree.txt # .*:匹配任何以点(.)开头的文件,例如 .gitignore、.bashrc 等。 # __*:匹配任何以双下划线(__)开头的文件夹,例如 __pycache__。 # | 符号来组合多个模式 压缩解压缩操作 #
docker部署Caddy服务器的文件共享服务
部署网站 # Caddyfile 需要参考下面官方的代码修改一下 docker run -d \ --name caddy_myprofile \ -p 8082:80 \ -p 8083:443 \ -v $PWD/Caddyfile:/etc/caddy/Caddyfile \
docker 安装 Nginx Proxy Manager
镜像构建容器 docker run -d \ --name nginx-proxy-manager \ --restart=always \ -p 80:80 \ -p 9081:81 \ -p 443:443 \ -v "$PWD/data:/data" \ -v "$
python dev常用模块-多线程
import threading class MyThread(threading.Thread): """ 自定义线程类,用于执行指定的函数并获取返回值。 """ def __init__(self, func, args=(), kwargs={}):
获客系统探索
step01 通过similarsites查找类似的网站 https://www.similarsites.com/ step02 解析网页里的mail邮箱发送邮件
docker部署superset
docker run 方式 # 生成SUPERSET_SECRET_KEY openssl rand -base64 42 # docker 拉取镜像并运行 docker run -d \ -p 8088:8088 \ -e "SUPERSET_SECRET_KEY=BPmoejU
python dev使用parse获取页面元素
在Python中,使用parse库的Selector对象获取页面元素后,有几种常用的方法可以进一步操作这些元素: 1. 使用.xpath()方法: • 优点:XPath是一种在XML文档中查找信息的语言,对于HTML文档也同样适用。它能够通过元素的层级关系、属性、文本内容等进行复杂的选择。 • 缺点
Coupang项目笔记
详情页 详情页部分优先顺序: 当前产品:为主要 相关联的产品:为次要 原因: 相关联的产品由于在同一个类目或者同一个关键词搜索的情况下,产品列表页面所展现出来的存在大量重复的情况,尤其以热销或者投流的产品常常在首页不同的产品的相关产品页面被展示出来,所以应该是按照该类目或者关键词的所有产品的相关产品