1. Нужен парсер Яндекс.Карт
В аттаче готовая реализация остаётся только выстроить нужный нам процесс структурированного забора\хранения\обновления
В запросе можно указывать точные области поиска на карте, но достаточно и просто формулировать запрос с правильным адресом, т.е. в строке запроса передаём «Сумы, Украина автомагазины», «Санкт-Петербург, Россия парикмахерские»
Параметр results позволяет получить тонну данных за 1 запрос (*** иногда яндекс не отдаёт данные и нужно повторять запросы неоднократно) есть ли там то, что нужно выдирать более хитрым образом неизвестно, но выяснится в процессе, а для старта данных на 200% хватит
Выпарсивается абсолютно полная информация о найденных компаниях
- название
- описание
- ближайшие метро \ расстояния
- время работы
- адрес (для «навигации» страну и город лучше сразу выделить в отдельные поля)
- все телефоны и их комментарии
- все почтовые ящики
- способы оплаты
- адрес сайта
- изображение
- категории
В единой БД всё это раскладывается по разным полям, и в том числе делается отдельное поле:
- «запрос, по которому была взята эта информация»
- уникальный яндексовый ИД (для корректного обновления общий базы и возможной реализации переобновления данных об организациях)
- дата получения информации
2. В процессе сбора у всех сайтов, для которых прописан сайт получается и сохраняется в БД дополнительная картинка
mini.s-shot.ru/1024x450/7... 3. Все данные по итогу складываем в 1 таблицу, название таблицы data_yamaps, первое поле обязательно должно быть id (инкремент), последнее used (пустое). Остальные поля именуем на латинице понятными названиями, отражающими суть хранимых в них данных.