MacOS_Parsers/Parser_NEXT/README.md
2025-08-24 15:11:06 +03:00

691 B

NEXT.pl Parser (Playwright, Python 3.12)

Quick start

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromium
python main.py

categories.xlsx — формат ввода:

  • Первая колонка (A) — ссылки на категории (без заголовка).
  • Любые другие колонки (B, C, …) игнорируются (можно писать пометки).
  • Пустые строки и ячейки не учитываются.

Outputs land in records_folder/ as XLSX (+CSV/JSONL). Configure selectors/scroll in config.yaml.