Федеральное государственное автономное образовательное учреждение высшего профессионального образования
"Национальный исследовательский университет "Высшая школа экономики"
Институт демографии
База данных Института демографии
Исследовательский проект "Разработка Базы данных демографических показателей по регионам России и странам мира"
№11-04-0039 по конкурсу Программы "Научный фонд ГУ-ВШЭ" "Учитель-Ученики" 2011-2012 гг.
.

Общее описание системы

.
 

База данных представляет собой коллекцию демографических данных, собранных из различных источников.

Основной единицей доступа в Базе данных является демографический показатель. Минимальная порция демографических данных называется в системе "информационный массив" (data cube), который содержит значения одного конкретного показателя, полученных их одного кокретного источника данных в некоторый момент времени. В его качестве может служить база данных, файл, электронное издание или публикация. На конец 2012 года система содержит около 400 массивов.

Каждый показатель может иметь один или несколько разрезов - категорий, по которым База данных содержит значения данного показателя, например, по полу, возрасту, периоду, стране, направлению миграции,...

Пользователь системы имеет возможность выбрать любой показатель и один из его разрезов. Для сделанного им выбора система формирует результат запроса к коллеции данных "на лету". Фрагмент этого результата изображается на экране в виде таблицы 7*8 с первыми и последними строками и столбцами. Полный результат запроса может иметь форму текстового (CSV) или Excel файла, доступ к которым предоставляется после выбора соответствующей кнопки. Если часть из использованных источников данных по каким-либо соображениям вызывает сомнения или недоверие, пользователь имеет возможность уточнить перечень использованных источников, отметив только те из них, которые его устраивают. В этом случае результат запроса будет пересчитан.

Поскольку общее число показателей в Базе данных приближается к сотне, для облегчения ориентирования в их длинном списке система предоставляет возможность сужения перечня путем выбора показателей 1) по виду демографических процессов и 2) по характеру индикатора. Первый список содержит 6 позиций: рождаемость, смертность, миграция, брачность, воспроизводство, население. Второй - абсолютные, относительные, возрастные и интегральные показатели.

Разработка Базы данных производилась со сремлением выполнить следующий принцип: новые показатели, новые категории населения, новые информационные массивы не требуют корректировки математического обеспечения Базы данных.

При разработке Базы данных накоплен определенный опыт описания информационных массивов, в том числе по такой важной характеристике, как единица измерения демографического показателя. Многообразие единиц измерения в разных исходных массивах требуют их синхронизации при формировании результата запроса. В рамках Базы данных пересчет значений показателя, полученных из разных источников и имеющих различные единицы измерения, производится "на лету" при выполнении запроса. Данная функция выполняется автоматически, без участия пользователя.

База данных, кроме того, содержит такую дополнительную вспомогательную опцию, как фильтрация значений показателя, которые заведомо содержат ошибку или противоречат современной демографической статистике. Необходимость этого возникла ввиду нередкого попадания таких значений в исходные информационные массивы.

 

Версия 1.0 от 30.11.2012

.