18 lines
691 B
Markdown
18 lines
691 B
Markdown
# NEXT.pl Parser (Playwright, Python 3.12)
|
|
|
|
## Quick start
|
|
```bash
|
|
python -m venv .venv
|
|
source .venv/bin/activate # Windows: .venv\Scripts\activate
|
|
pip install -r requirements.txt
|
|
python -m playwright install chromium
|
|
python main.py
|
|
```
|
|
|
|
**categories.xlsx** — формат ввода:
|
|
- Первая колонка (A) — ссылки на категории (без заголовка).
|
|
- Любые другие колонки (B, C, …) игнорируются (можно писать пометки).
|
|
- Пустые строки и ячейки не учитываются.
|
|
|
|
Outputs land in **records_folder/** as XLSX (+CSV/JSONL). Configure selectors/scroll in **config.yaml**.
|