Александр Копытов
Фрилансер Александр Копытов Системный администратор tixit

Александр Копытов

На сайте 15 лет и 1 месяц (заходил 7 месяцев 21 день назад)
Свободен
18
39
7251.31
Рейтинг
7251.31
Выбран исполнителем
39

Проектирование, разработка и внедрение кластерных систем высокой нагрузки.
Разработка *nix интернет-ботов, всевозможных парсеров.
Систем сбора статистики по логам работы различных сервисов.
Установка и администрирование linux-серверов.
Нагрузочное тестирование серверов.

Специализация:   Аутсорсинг и консалтинг / Системный администратор

Опыт работы:  10 лет

Разработка узкоспециализированных высокоскоростных web-серверов.
Типичный проект: отказоустойчивый и масштабируемый кластерный движок браузерной игры, портала и т.п. из 5 VDS.
Стоимость аренды оборудования у хостера – около 2000 рублей в месяц.
Производительность ~ 20 миллионов http-запросов в сутки

 

Движок предназначен для создания распределенных систем регистрации поступающей информации со счетчиков интернет-статистики. Производительность одного узла кластера – от 500 http-запросов в секунду в зависимости от мощности используемого серверного оборудования. В системе используются высокоскоростные узкоспециализированные веб-серверы. Производительность системы находится в прямой зависимости от объема оперативной памяти: чем больше памяти, тем больше производительность.

Ядро парсера обладающий большой степенью универсальности, способного преодолевать многие средства защиты.

Максимально настраиваемый: параметры настройки, такие как User-Agent, частота сканирования одного ресурса и прочее задаются в базе данных.

Многопоточный: для ускорения робот умеет сканировать различные сайты параллельными потоками.

Вежливый: робот в работе может использовать файл сайта 'robots.txt'.

Мимикрия: робот очень похож на браузер. Поддержка cookie и заголовков, которые браузер в обязательном порядке отправляет серверу.

Универсальный: вы сможете легко его настроить на сканирование новых сайтов.

Идеален для встраивания в сайт, так как закачивает данные прямо в существующую базу сайта.

Работает с текстами, картинками, фото.

Скрипт для скоростного поиска Radmin-серверов. Скорость работы зависит от объема оперативной памяти и ширины интернет-канала. В лог-файл записывает IP-адреса найденных серверов, его версию, способы аутентификации.

Алгоритм оценки схожести текстов с учетом русской морфологии и использованием векторов в многомерном пространстве. Метод позволяет с намного большей достоверностью оценить схожесть текстов, чем это делает шингл-алгоритм. Так тексты оцениваемые по шинглам со сходством в 30-50% оказывались на самом деле схожими на 90-95%. Алгоритм использует в работе довольно большую (свыше 100 мб) базу словоформ русского языка и тяжелые вычисления. Так поиск дубликатов 100000 документов на сайте статей выполнялся около недели с использованием 10 серверов. Анализ обнаруженного дублированного контента с привлечением человека показал, что статьи являются очень качественным рерайтом.

Проведение нагрузочного тестирования – неотъемлемая частью веб-разработки промышленных масштабов.
Проверки ПО под нагрузкой необходимо начинать еще с самых ранних стадий разработки. Также время от времени по мере появления нового функционала необходимо проводить повторные тестирования под нагрузкой. Обычно тесты проводимые самими разработчиками на локальном сервере могут выдавать очень оптимистичные прогнозы по производительности системы. Однако эксплуатация изделия в реальных условиях приносит иной раз неприятные сюрпризы в области производительности, масштабируемости и стабильности.

Модуль perl для скачивания информации с сайтов, использующих различные методы блокирования роботов-пауков.
Использует максимально похожие на браузерные методы работы с сайтами.
все стандартные заголовки браузеров;
работа с cookie;
keep-alive соединения;
поддержка кеширования if-modified-since;
поддержка сжатого контента;
поддежка работы через различные типы прокси-серверов;
и т.п.

Функционал: между пользователем и сервером встраивается редактирующий прокси-сервер. Это позволят изменять любые заголовки и тела запросов и ответов. Т.е. все что отправляется от пользователя к серверу, так и от сервера к пользователю. Это может быть подмена заголовка user-agent на правильное значение, удаление баннеров со страниц, или наоборот вставка своей рекламы. Сокрытие сервера либо клиента. А также масса других вариантов.

   
 

В стандартной конфигурации сервер базы данных Mysql настроен так, чтобы удовлетворительно работать под практически любым проектом. Если же вы желаете добиться отличной производительности от своего проекта, вам потребуется произвести тонкую наладку базы данных.

 

Веду разработку и наполнение базы данных лексем русского языка, включающей на данный момент в себя более 100 тысяч слов в начальной форме, а также все их словоформы.
Объем базы данных составляет около 100 мб и покрывает более 99% самых часто используемых слов. База данных формировалась путем сканирования различных словарей русского языка.

Разработка, анализ и оптимизация структуры существующей БД;

Участие при выработке требований, проектировании, разработке, сопровождении БД;

Разработка нормативных документов, определяющих разработку БД, контроль их исполнения;

Моделирование и документирование БД;

Консультирование по вопросам разработки и сопровождения БД.

Услуги по проведению аудита структуры баз данных:
обнаружение тяжелых запросов,
мероприятия по оптимизации запросов,
мероприятия по изменению структуры базы данных.

 
 

#  Аутсорсинг и консалтинг / Системный администратор

nagios, nginx, debian, ubuntu, centos, freebsd, clamav, subversion, TortoiseSVN, svn, vpn, openvpn, webmin, directadmin, plesk, ispmanager, bind9, apache, cpan, php Все 46 тегов

 
 
 
 

Разрабатываю под ключ различного рода системы управления с использованием электронных цифровых подписей (ЭЦП) на основе собственной CMS с использованием алгоритмов RSA, DSA, Diffie-Hellman, ГОСТ Р 34.10-2001
Основной функционал ядра системы:
управление пользователями системы и настройки безопасности;
управление ЭЦП пользователей(ведение реестра ЭЦП, выдача, аннулирование и продление сертификатов);
проведение зашифрованного документооборота;

Провожу работы по проектированию, разработке и эксплуатации защищенных сетей с использованием технилогии VPN.
VPN (англ. Virtual Private Network — виртуальная частная сеть) — обобщённое название технологий, позволяющих обеспечить одно или несколько сетевых соединений с использованием средств криптографии (шифрованию, аутентификация, инфраструктуры публичных ключей, средствам для защиты от повторов и изменения передаваемых по логической сети сообщений).

В зависимости от применяемых протоколов и назначения, VPN может обеспечивать соединения трёх видов: узел-узел, узел-сеть и сеть-сеть.

 

Разработка серверной игровой инфраструктуры:
JSON-движки игр.
Comet-серверы для передачи данных от сервера к игровому клиенту, так и в обратную стороны.
CDN сети доставки игрового контента.

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».