具备5年数据分析与网络爬虫开发经验,熟练使用 Python 进行数据采集、清洗、分析与建模,能够独立完成从数据获取到业务落地的全流程开发。熟悉主流爬虫框架与反爬策略,具备处理复杂数据源和大规模数据的能力。
技术栈包括:
数据分析
熟练使用:Pandas、NumPy、Matplotlib、Seaborn
熟悉数据建模、指标体系搭建、数据可视化
掌握基础机器学习(分类、回归、聚类)
爬虫开发
熟练使用:Requests、BeautifulSoup、Scrapy
掌握 Selenium / Playwright 处理动态渲染页面
熟悉常见反爬策略:IP代理、UA伪装、验证码处理、限速控制
数据处理与存储
MySQL / PostgreSQL
MongoDB / Redis
熟悉数据ETL流程设计
工程能力
熟悉 Linux 环境部署
熟练使用 Git 进行版本管理
能够编写高可维护性、模块化代码
其他能力
熟悉 RESTful API 调用与数据对接
具备良好的数据敏感度和业务理解能力
项目描述:
搭建电商平台商品价格监控系统,对多个平台(如B2B/化工/电商网站)商品数据进行抓取与分析,支持价格趋势分析与竞品对比。
技术要点:
使用 Scrapy + Requests 构建分布式爬虫系统
使用 Selenium 处理动态加载页面
通过代理池 + UA轮换绕过反爬机制
数据存储至 MySQL + Redis 缓存
使用 Pandas 进行数据清洗与分析
个人职责:
负责爬虫架构设计与核心代码开发
设计数据表结构及数据清洗流程
构建价格波动分析模型
输出可视化报表(Matplotlib)
项目成果:
日均采集数据量 > 50万条
数据准确率提升至 95%+
帮助业务识别低价竞品,提高定价策略响应速度
可兼职时间
可兼职地点
0条评论 雇主评价