diff --git a/Parsing ZARAHOME/src/__pycache__/categories.cpython-313.pyc b/Parsing ZARAHOME/src/__pycache__/categories.cpython-313.pyc new file mode 100644 index 0000000..38b4a1a Binary files /dev/null and b/Parsing ZARAHOME/src/__pycache__/categories.cpython-313.pyc differ diff --git a/Parsing ZARAHOME/src/extractor.py b/Parsing ZARAHOME/src/extractor.py index 847d6c1..66ac1b2 100644 --- a/Parsing ZARAHOME/src/extractor.py +++ b/Parsing ZARAHOME/src/extractor.py @@ -302,7 +302,7 @@ class Extractor: partnumber_val = size.get("partnumber", "") country = size.get("country") or "" - trace_local = f"Страна изготовления {country}" if country else trace + trace_local = f"Made in {country}" if country else trace row = [ url_full, diff --git a/Parsing ZARAHOME/src/records_folder/jhsdfgjshdf.pu b/Parsing ZARAHOME/src/records_folder/jhsdfgjshdf.pu new file mode 100644 index 0000000..e69de29 diff --git a/Processing/0_01_слияние_всех эксель файлов из папки в один одинаковый формат.py b/Processing/0_01_слияние_всех эксель файлов из папки в один одинаковый формат.py new file mode 100644 index 0000000..874b1b3 --- /dev/null +++ b/Processing/0_01_слияние_всех эксель файлов из папки в один одинаковый формат.py @@ -0,0 +1,30 @@ +import pandas as pd +import os + +# Укажите путь к папке, где находятся все файлы Excel +folder_path = '/Users/valis/Yandex.Disk.localized/Python3/Parsing ZARAHOME/src_2024-09-05/records_folder' +# Укажите путь и имя нового файла Excel, в который будут скопированы все строки +output_file = os.path.join(folder_path, 'Allfile.xlsx') + +# Считываем все имена файлов в папке +files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')] + +# Флаг для определения, является ли текущий файл первым (для записи заголовков) +first_file = True + +# Открываем файл Excel для записи +with pd.ExcelWriter(output_file, engine='openpyxl') as writer: + for file in files: + file_path = os.path.join(folder_path, file) + try: + df = pd.read_excel(file_path, engine='openpyxl') + + # Если это первый файл, записываем с заголовками + if first_file: + df.to_excel(writer, index=False, sheet_name="Sheet", startrow=0, header=True) + first_file = False + else: + # Иначе записываем без заголовков, продолжая с последней строки + df.to_excel(writer, index=False, sheet_name="Sheet", startrow=writer.sheets["Sheet"].max_row, header=False) + except Exception as e: + print(f"Ошибка при обработке файла {file}: {e}")