Ищем программиста для постоянного сотрудничества!
Предоставим исходники на Питоне, нужно сделать следующее:
парсер работал прекрасно, но перед акций ЖУМА перестал. похоже, что-то изменилось на сайте Kaspi Магазина. парсер выдаёт ошибку, см. скриншот. Нужно исправить, чтобы продолжил парсить
Оплата обсуждается индивидуально.
полагаю, что кусок кода, который вызывает ошибку, выглядит так:
def get_page(url_, headers):
try:
session = requests.Session()
print('reading url', url_)
request = session.get(url_, headers=headers)
tree = html.fromstring(request.content, parser=etree.HTMLParser(encoding="utf-8"))
script = tree.xpath('//script[contains(., "BACKEND.components.catalogGrid")]/text()')[0]
data = regex.compile(r"\{(?:[^{}]|(?R))*\}").findall(script)[0]
return json.loads(data)
except Exception as ex:
print(ex, 'get_page')