| .. | ||
| tests | ||
| .env.example | ||
| categories.xlsx | ||
| config.yaml | ||
| fetcher.py | ||
| main.py | ||
| models.py | ||
| parser.py | ||
| README.md | ||
| requirements.txt | ||
| sink.py | ||
| utils.py | ||
NEXT.pl Parser (Playwright, Python 3.12)
Quick start
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromium
python main.py
categories.xlsx — формат ввода:
- Первая колонка (A) — ссылки на категории (без заголовка).
- Любые другие колонки (B, C, …) игнорируются (можно писать пометки).
- Пустые строки и ячейки не учитываются.
Outputs land in records_folder/ as XLSX (+CSV/JSONL). Configure selectors/scroll in config.yaml.