Предыстория проблемы: У нас есть поставщик компания Русклимат. Она предоставляет выгруженный в xml каталог с кучей ресурсов и ссылками. Ранее мы нанимали программиста, чтобы спарсить данный каталог на сайт, Парсинг был произведен, но это было единоразовое действие и как следствие каталог не обновлялся и материал стал не актуальным (а поставщик предоставляет обновленный каталог каждую неделю).
Задача автоматизировать загрузку данного каталога на сайт (OpenCart 2.3), или грузить в 1С УП 10 , а потом выгрузка на сайт. (Постоянно обновлять все данные каталога не обязательно, достаточно обновлять цену и количество товара на складе. Каждый товар имеет свой SKU. Интеграция 1С и сайта в планах работ)
Возможно долгосрочное сотрудничество т.к. постоянно получаем новые каталоги от поставщиков в различном формате.
Готов предоставить ссылку для скачивания каталога, он имеет довольно большой объем.
Предложение прошу присылать в личку.
Описание формата каталога:
Распаковав архив видим следующую структуру каталогов и файлов:
§ goods – каталог с карточками товаров и стилем
§ goods/brands – каталог с картинками брендов
§ goods/goods – каталог с картинками товаров
§ index.html – HTML файл с краткой информацией о всех товарах со ссылкой на карточку товара
§ catalog.xml – XML файл с каталогом и карточками всех товаров
Формат XML файла catalog.xml
Тэг <name> содержит имя компании.
Тэг <company> включает в себя краткое описание компании
Тэг <url> содержит URL адрес главного сайта компании «Русклимат»
Тэг <currencies> состоит из тэгов <currency> со свойствами: id – денежная единица и rate – курс денежной единицы по отношению к рублю.
Тэг <categories> содержит в себе все товарные категории и состоит из дерева подтэгов <category>, который содержит наименование категории, а его свойства: id – ID категории и parentId – ID родительской категории.
Тэг <offers> состоит из карточек товаров. Рассмотрим более подробно структуру карточки товара, которая хранится в тэге <offer>:
<file> - имя HTML файла с карточкой товара
<price> - цена товара
<currencyId> - валюта в которой указана цена товара
<priceRub> - цена товара в рублях
<categoryId> - ID категории, к которой относится товар
<picture> - имя файла с картинкой товара
<picturebrand> - имя файла с картинкой бренда
<vendor> - имя бренда
<vendor_url> - URL бренда
<model> - название товара
<description> - описание товара
<parameters> - параметры товара со ссылками на сайт бренда и инструкцию в формате PDF
Тэг <offer> содержит одно свойство id, которое указывает на ID товара.