MacOS_Parsers/Parser_NEXT
2025-09-01 16:57:29 +03:00
..
out IKEA сбор новых и редактирование категорий 2025-09-01 16:57:29 +03:00
tests NEXT 2025-08-24 15:11:06 +03:00
.env.example NEXT 2025-08-24 15:11:06 +03:00
categories.xlsx IKEA сбор новых и редактирование категорий 2025-09-01 16:57:29 +03:00
config.yaml IKEAmain for WIN 2025-08-25 14:46:19 +03:00
fetcher.py IKEAmain for WIN 2025-08-25 14:46:19 +03:00
main.py IKEAmain for WIN 2025-08-25 14:46:19 +03:00
models.py IKEAmain for WIN 2025-08-25 14:46:19 +03:00
parser.py NEXT 2025-08-24 15:11:06 +03:00
README.md NEXT 2025-08-24 15:11:06 +03:00
requirements.txt NEXT 2025-08-24 15:11:06 +03:00
sink.py IKEAmain for WIN 2025-08-25 14:46:19 +03:00
utils.py NEXT 2025-08-24 15:11:06 +03:00

NEXT.pl Parser (Playwright, Python 3.12)

Quick start

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -r requirements.txt
python -m playwright install chromium
python main.py

categories.xlsx — формат ввода:

  • Первая колонка (A) — ссылки на категории (без заголовка).
  • Любые другие колонки (B, C, …) игнорируются (можно писать пометки).
  • Пустые строки и ячейки не учитываются.

Outputs land in records_folder/ as XLSX (+CSV/JSONL). Configure selectors/scroll in config.yaml.