Заказчик
Отзывы фрилансеров:
+ 21
- 0
Зарегистрирован на сайте 13 лет и 9 месяцев
Бюджет:
по договоренности
сроки и бюджет.
Задача
Разобраться со структурой базы в формате CSV и предоставить описание значения каждой колонки (столбца). В базе всего 23 колонки.
Детали
База представляет собой записи почтовых индексов Финляндии с указанием к какой местности, улице и дому относится запись.
Опытным путем была выявлена примерно следующая структура базы:
1) Почтовый индекс и название местности или организации на финском
2) Название местности или организации на шведском
3) Аббревиатура на финском
4) Аббревиатура на шведском
5) Название улицы на финском
6) Название улицы на шведском
7) Дальше идет 15 непонятных колонок. Скорее всего, часть из них показывает номера домов в финском варианте, часть в шведском. Так же часть может быть идентификатором типа местности: город, поселок и т.д.
8) Название местности на финском
9) Название местности на шведском
Опираясь на это, необходимо сделать следующие:
1) Убедиться, что вышеуказанный формат колонок верен.
2) Разобраться с 15-ью непонятными колонками, указанными в 7 пункте выше: понять, где номера домов, где указатели на тип местности и что значат остальные колонки.
Требуемый результат: описание каждой колонки (столбца) и критерии в каких случаях у нее нет значения, вот примеры возможных критериев:
1) Запись в такой-то колонке отсутствует, если почтовый индекс указан для всех улиц в населенном пункте.
2) Запись в такой-то колонке отсутствует, если почтовый индекс указан для всех домов на указанной улице .
3) Запись в такой-то колонке отсутствует, если почтовый индекс указан для всех остальных домов в населенном пункте, для которых номера домов не указаны явно.
Если у вас возникнут сложности, попробуйте рассмотреть колонки, учтя следующие 2 нюанса:
1) Иногда для городов записи домов присутствуют только, например, в колонках 7-8, а для поселков в других колонках это своего рода индикатор для какого типа местности указан почтовый индекс.
2) Записи 0, 1, 2 могут быть индикаторами, что почтовый индекс указан: 0 для всех домов, 1 для нечетных, 2 для четных.
Все уникальные комбинации записей в базе предоставлены в файле unique.csv.
Разделы:
Опубликован:
15.12.2018 | 02:06