Программа «Анализ частных объявлений — Недвижимость»

Программа «Анализ частных объявлений — Недвижимость» реализована как механизм извлечения частных объявлений о продаже недвижимости из электронных версий газет «Из рук в руки» (все города), «Реклама-Шанс» (Санкт-Петербург), «Бюллетень недвижимости» (Санкт-Петербург), а также с сайта Moyareklama.ru в локальную базу данных с целью последующего анализа. На основе полного текста объявлений строятся аналитические поля: количество комнат, район, улица, метро, время от метро, площади, этажи, тип дома, район города по первым цифрам телефонного номера и многие другие. Далее вы можете удобно сортировать, фильтровать, искать, печатать и экспортировать их. Вы также можете вести базу данных по объектам недвижимости. Программный интерфейс позволяет создавать новые таблицы, добавлять поля к ним (как хранимые, так и вычисляемые), хранить в базе данных картинки, строить дерево данных по любым полям, выделять записи цветом и многие другие удобства.

Пошаговое описание

Разберем все на конкретном примере. Допустим, вы хотите купить 2-х комнатную квартиру в Санкт-Петербурге. Доступные предложения надо извлечь с серверов.

1. Извлечение объявлений с сайта газеты «Из рук в руки»

Переключаемся на вкладку «Из рук в руки» и следуем инструкциям в строке-статусе. Сначала там будет написано «Нажмите кнопку ‘Переход’ чтобы перейти на страницу». Начальный URL-адрес уже выбран и вам остается только нажать эту кнопку. Далее последует ряд экранов, надо выбрать город, раздел (недвижимость, квартиры) — все в соответствии с организацией сайта газеты «Из рук в руки». Необходимо добраться до страницы с формой поиска:

Заполняем форму, указывая район, количество комнат, общую площадь, диапазон цен, ключевые слова и т.д. После того, как форма заполнена, нажимаем кнопку «Старт» программы (не нажмите по инерции кнопку «Найти» самой страницы). Если запрос не слишком узкий, в результате получится где-то несколько десятков, а то и сотен объявлений. Просмотр объявлений на сайте организован с разбиением строго по 30 объявлений на страницу (Санкт-Петербургский сайт), что неудобно. Кроме того, указывается только заголовок, цена и регион. Чтобы прочитать полный текст объявления и добраться до контактной информации, надо вскрывать каждое объявление по отдельности. Программа «Анализ частных объявлений — Недвижимость» всю эту работу проделает автоматически. Все объявления будут извлечены в локальную базу данных. Эффективность извлечения будет зависить от скорости Вашего канала доступа в интернет и от загрузки серверов (прогресс отражается с строке состояния).

2. Извлечение объявлений с сайта газеты «Реклама-Шанс»

Печатное издание «Реклама-Шанс» выпускается только в Санкт-Петербурге и Ленобласти, поэтому основная масса объявлений на сайте относится к этому региону. Однако, присутствует и определенная доля объявлений из других городов. Здесь, как и в случае с «Из рук в руки», надо выбрать нужный раздел и дойти до страницы с формой поиска. Задаем критериии поиска. Можно сразу указать район, цену, ключевые слова — раз сайт это позволяет, иначе может получиться слишком много ненужных объявлений и, соответственно, много переходов по страницам. А можно извлечь абсолютно все объявления по 3-х комнатным квартирам в Петербурге, не указывая конкретику, а потом уже удалить все ненужное — конечно, если у вас хороший интернет-канал. «Реклама-Шанс» показывает по 100 объявлений на странице, поэтому очень много переходов не будет в любом случае. Но существует другая вероятная проблема. Сайт содержит слишком много рекламы, выполненной в виде Flash-роликов. Она, во-первых, делает страницы «тяжелыми», они долго грузятся, а иногда могут не догружаться вовсе. Хотя конечно, все зависит от скорости Вашего интернет-канала. Во-вторых, сжирает очень много ресурсов компьютера. Поэтому желательно, чтобы у вас был более-менее производительный компьютер. Заполнив форму, нажимаем кнопку «Старт» программы (не путая с кнопкой «Найти » на странице).

3. Извлечение с других сайтов

Здесь, каждый раз, когда осуществляется переход на новую страницу, программа пытается найти объявления по недвижимости. Если находит объявления или ссылки на объявления, сообщает сколько нашла и предлагает извлечь. Конечно нельзя гарантировать, что программа будет нормально находить и извлекать объявления с абсолютно любой HTML страницы, поскольку организация структуры страницы может быть в принципе очень нестандартной (с точки зрения программы «Анализ частных объявлений — Недвижимость»). Иногда бывает трудно отличить объявление от строчной рекламы и т.д. Эту функциональность можно скорее назвать как попытка обнаружения и извлечения объявлений о недвижтмости с условно любой HTML страницы. На вкладке «ДРУГИЕ URL» в ниспадающем списке адреса содержатся сайты, с которыми протестирована эта функциональность. Вы можете предложить адаптировать программу к каким-либо другим сайтам.

4. Анализ

По окончании извлечения по полному тексту объявления строятся аналитические поля. Программа как бы «читает» объявление, раскладывая все «по полочкам». Вы получаете строго структурированную информацию. Полей очень много — Объект, цена, район, улица, тип дома, площадь общая/жилая/кухни, тип санузла, состояние и т.д. В общем, учтено почти все, что может быть полезно при выборе объекта недвижимости.
Локальная база данных программы представляет собой таблицу со списком всех извлеченных объявлений вместе с аналитическими полями, пользовательскими полями и пользовательскими таблицами. Также имеется несколько служебных таблиц с полезной информацией (списки улиц, районов, станций метро для Москва и СПб). Все таблицы удобно просматриваются и редактируются с помощью программы.

Установка программы

Для установки программы необходимо:

  • Скачать программу (на нашем сайте выложена демо-версия программы)
  • Запустить программу установки сделав двойной клик на скаченном файле
  • Следуя инструкциям программы-установщика инсталлировать программу на жесткий диск
  • Запустить программу, выбрав ее в меню «Программы» по нажатию кнопки «Пуск» или ярлык на рабочем столе.

Скачать полную версию вы можете на сайте «Простой софт»