基于大语言模型的智能求职平台
一个集成了岗位数据爬取、LLM智能分析、简历解析和AI模拟面试的全栈求职辅助系统。
- 支持多家大厂招聘数据爬取(腾讯、网易、字节跳动、Amazon等)
- API爬取 + Selenium浏览器自动化双模式
- 自动数据清洗和格式标准化
- 自动提取岗位学历要求、专业要求
- 技能标签识别与重要性评分(1-5分)
- 岗位族谱分类(一级/二级分类)
- PDF/Word简历智能解析
- 技能标签提取与评分
- 岗位-简历匹配度计算
- 基于岗位JD生成针对性面试问题
- 多轮对话式面试模拟
- 实时反馈与建议
FindJobs-Agent/
├── FrontEnd/ # React前端
│ ├── src/
│ │ ├── components/ # 页面组件
│ │ │ ├── JobsPage.tsx # 岗位浏览
│ │ │ ├── ResumePage.tsx # 简历分析
│ │ │ └── InterviewPage.tsx # AI面试
│ │ └── App.tsx
│ └── package.json
├── job_crawler_v2.py # 多公司爬虫(主力)
├── job_crawler_selenium.py # Selenium爬虫
├── job_agent.py # LLM岗位分析Agent
├── pipeline.py # 数据处理流水线
├── api_server.py # Flask API服务
├── AI_interviewer.py # AI面试模块
├── resume_parser.py # 简历解析
├── tag_rate.py # 技能评分
├── llm_client.py # LLM客户端
├── tech_taxonomy.json # 岗位分类体系
├── all_labels.csv # 技能标签库
└── requirements.txt
- Python 3.9+
- Node.js 18+
- Chrome浏览器(Selenium爬虫需要)
git clone https://github.com/universeplayer/FindJobs-Agent.git
cd FindJobs-Agentpip install -r requirements.txt创建 API_key.md 文件,填入你的OpenAI API Key:
sk-your-api-key-here
python api_server.pycd FrontEnd
npm install
npm run dev打开浏览器访问 http://localhost:8080
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 爬取岗位 │ -> │ LLM分析 │ -> │ 技能提取 │ -> │ 网站展示 │
│ job_crawler│ │ job_agent │ │ tag_rate │ │ api_server │
└─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘
# 爬取 + 分析 + 生成网站数据
python pipeline.py
# 仅爬取
python job_crawler_v2.py -c tencent netease amazon -m 300
# 仅分析(测试)
python pipeline.py --analyze-only --max-jobs 50多公司岗位爬虫,支持:
- 腾讯、网易、字节跳动、Amazon(稳定)
- 阿里、美团、京东等(Selenium模式)
# 爬取指定公司
python job_crawler_v2.py -c tencent netease -m 500
# 列出支持的公司
python job_crawler_v2.py --listLLM驱动的岗位分析Agent:
- 学历要求提取(本科/硕士/博士)
- 专业要求识别
- 技能标签匹配与评分
- 岗位分类
AI模拟面试系统:
- 根据JD生成面试问题
- 多轮对话交互
- 答案评估与反馈
| 接口 | 方法 | 说明 |
|---|---|---|
/api/jobs |
GET | 获取岗位列表 |
/api/jobs/<id> |
GET | 获取岗位详情 |
/api/resume/upload |
POST | 上传简历 |
/api/resume/analyze |
POST | 分析简历 |
/api/interview/start |
POST | 开始面试 |
/api/interview/answer |
POST | 提交答案 |
欢迎提交 Issue 和 Pull Request!
MIT License