PRIL8.HTML
Международные рейсы - табло вылетов шереметьево самолетов из Москвы.

Е.В. Бойченко, А.В. Михеев

Персональный идентификационный номер

гражданина как средство интеграции баз данных

о населении

1. Введение

В настоящей статье рассмотрены вопросы построения идентификационного номера гражданина, основные проблемы его формирования и возможные направления разработки и внедрения технологий идентификации граждан. Описанные работы проводятся ассоциацией “Сириус” в рамках разработки проекта концепции создания автоматизированной системы “Государственный регистр населения”. Предложенные в статье методологии идентификации граждан апробированы Инженерно-внедренческим центром “Инсофт” при создании автоматизированного интегрированного банка данных “Население” Москвы, многоуровневой автоматизированной системы “ЗАГС” Москвы, Государственной автоматизированной системы “Выборы” по г. Москве в части комплекса функциональных задач “Учет избирателей”.

2. Актуальность проблемы идентификации граждан

Решение вопроса идентификации граждан имеет большое значение при проектировании автоматизированной системы “Государственный регистр населения” (АС ГРН).

В соответствии с проектом концепции АС ГРН к основным целям создания АС ГРН в числе других относятся:

· Обеспечение эффективного автоматизированного информационного обмена в сфере учета населения;

· Создание основы для объединения существующих и разрабатываемых баз данных по учету отдельных категорий населения в интегрированную систему баз данных о населении с соблюдением прав и интересов граждан.

Информационное обеспечение ГРН в числе других включает идентификацию граждан. В состав первичных персональных данных в числе других данных, фиксируемых в системе регистрационного учета, входит персональный идентификационный номер гражданина.

Однозначная идентификация личности является важнейшим требованием АС ГРН. В числе методов идентификации личности предполагается идентификация по персональному идентификационному номеру, проставляемому в паспорт и иные документы, удостоверяющие личность, и используемого во всех системах учета населения.

Согласно требованиям концепции АС ГРН персональный идентификационный номер должен удовлетворять следующим требованиям: неизменность на протяжении всей жизни гражданина, минимально возможной длиной, помехоустойчивостью, возможностью автоматического формирования в децентрализованном режиме.

При проектировании АС ГРН большую актуальность приобретают работы по анализу состояния дел по персональной идентификации граждан в АИС учета различных социально-профессиональных категорий граждан.

Единая методология формирования персонального идентификационного номера гражданина и технология его присвоения должна явиться важной частью ГРН России.

3. Краткий анализ вариантов формирования и использования персонального идентификационного номера гражданина

В настоящем анализе использованы материалы работы комиссии при Главном управлении вычислительной техники и систем управления ГКНТ, проекты нормативных документов по созданию АС “Персона” и АС “Госрегистр”, научно-методические материалы ВНИИ Проблем вычислительной техники и информатики (ВНИИ ПВТИ), а также практические методики ИВЦ “Инсофт” по созданию баз данных о населении.

Предлагаются два подхода использования идентификационного персонального номера гражданина: повсеместный и выборочный.

При повсеместном использовании каждому гражданину страны присваивается уникальный номер – идентификационный персональный номер гражданина. Этот номер проставляется во все личные документы граждан: свидетельство о рождении, паспорт, удостоверение личности военнослужащего, трудовую книжку, страховое свидетельство государственного пенсионного страхования, а также документы для служебного пользования. Такой подход предполагает, что во всех автоматизированных системах информация о гражданине хранится и передается вместе с идентификационным персональным номером.

Выборочное использование предполагает, что идентификационный персональный номер используется в базовых системах о населении: автоматизированных информационных системах первичного учета – паспортных столах жилищно-эксплуатационных организаций и органов внутренних дел, а также органах ЗАГС. В ведомственных автоматизированных системах используются свои идентификаторы, структура и разрядность которых определяется на основе системной функциональности.

По технологии формирования различаются четыре варианта построения идентификационного персонального номера гражданина.

В первом варианте роль персонального номера выполняют серии и номера документов, удостоверяющих личность. Для обеспечения уникальности персонального номера предлагается дополнительно использовать закодированную информацию о типе документа, дате его выдачи. В отдельных концепциях предлагается использовать комбинацию номера паспорта, даты и места рождения гражданина.

Согласно второму варианту роль персонального кода выполняет комбинация фамилии, имени и отчества гражданина и дополнительных параметров, таких как дата рождения и место рождения, дата рождения и место жительства.

Согласно третьему варианту персональный номер формируется на основе биологических данных человека: генетических характеристик, отпечатков пальцев, характеристик радужной оболочки глаза.

Согласно четвертому варианту персональный номер формируется в виде случайного числа или используется внутримашинный идентификационный номер. В отдельных концепциях предлагается дополнять такой персональный номер описанием места формирования идентификационного номера.

По способам формирования различают централизованное и децентрализованное формирование персонального идентификационного номера.

Ниже приведены оценки достоинств и недостатков различных вариантов формирования и подходов использования персонального идентификационного номера.

Повсеместное использование персонального идентификационного номера граждан предоставляет значительные преимущества при идентификации личности гражданина по широкому спектру документов, удостоверяющих личность. Существенными недостатками этого подхода являются очень большие затраты, связанные с его внедрением и поддержанием в актуальном состоянии, с созданием специальной службы присвоения номера.

Варианты, использующие для идентификации личности серии и номера документов, удостоверяющих личность, свободны от вышеназванных недостатков. Потребуются сравнительно небольшие затраты для изменений в процедурах регистрации граждан по месту жительства и месту пребывания, а также регистрации актов гражданского состояния. Существенным недостатком этих вариантов формирования персонального номера является необходимость жесткой централизации процедур выдачи и обмена паспортов, что в масштабах Российской Федерации реализовать достаточно трудно.

К недостаткам варианта формирование персонального номера на основе фамилии, имени и отчества относятся значительные затраты, связанные с подержанием уникальности персонального номера и его актуализацией при изменениях фамилии, имени и отчества.

На основе выше изложенного можно сделать следующие выводы.

1. Экономически нецелесообразно использовать персональный номер для текущего ввода и обработки данных об отдельных гражданах в ведомственных федеральных автоматизированных системах.

2. В качестве межсистемного идентификатора гражданина могут быть использованы серии и номера документов, удостоверяющих личность в комбинации с дополнительными параметрами гражданина: фамилией, именем, отчеством, датой рождения, местом рождения. При этом интегрированная система баз данных о населении может быть создана без значительных затрат.

3. Введение персонального идентификационного номера, проставляемого в документы личного пользования, требует значительных вложений на внедрение и эксплуатацию, но упрощает организационно процесс межсистемного обмена данными и создает удобства для опознавания личности по любому документу. При введении персонального идентификационного номера могут возникнуть психологические и организационные трудности.

Таким образом, несмотря на присущие системе идентификации личности с помощью персонального идентификационного номера недостатки нетехнического характера, признано, что для межсистемного взаимодействия она наиболее удобна и технологична. Имея в виду, что в ближайшее время вряд ли будет повсеместно введен идентификационный номер, проставляемый в основные документы, удостоверяющие личность, не следует отбрасывать такую возможность в более отдаленное время, так как для государства масштаба России это единственная возможность обеспечить систематизированный сбор и обработку данных о гражданах. Поэтому огромное значение приобретает необходимое условие интегрируемости автоматизированных систем, содержащих данные о населении, состоящее в наличии внутри системы однозначной технологии идентификации гражданина при любых изменениях его юридических параметров за любой период времени.

4. Вычисляемость – важное свойство персонального идентификационного номера

Для удобства дальнейшего изложения определим термины, употребляемые для обозначения различных способов идентификации записей в базах данных автоматизированных систем учета населения.

Персональный идентификационный номер - это номер гражданина, не изменяющийся на протяжении всей его жизни. Технология формирования должна обеспечивать уникальность номера на всей территории России при его формировании в децентрализованном режиме.

Регистрационный номер – это номер, присваиваемый каждой записи о гражданине в базе данных автоматизированной системы учета населения, который обеспечивает уникальность и однозначную идентификацию записей в пределах данной автоматизированной системы. В каждой автоматизированной системе может применяться своя система присвоения регистрационного номера, поэтому последний в общем случае не может применяться при межсистемном взаимодействии, за исключением тех случаев, когда технология его формирования совместима с технологией формирования персонального идентификационного номера.

Важной характеристикой способа формирования персонального (регистрационного) номера является его вычисляемость. Под вычисляемостью здесь подразумевается возможность корректно сформировать номер с использованием данных, которые могут быть получены на основе документов, удостоверяющих личность, или на основе биологических данных гражданин.

Невычисляемый персональный (регистрационный) номер, как правило, является внутрисистемным уникальным номером записи о гражданине и присваивается как порядковый с добавлением информации о месте формирования. Несмотря на обилие способов формирования невычисляемого регистрационного номера в распределенных системах учета населения, основные принципы едины для большинства систем.

Введем понятие источника персонального номера как комплекса средств автоматизации нижнего уровня, одной из функций которого является первичное формирование персонального номера. Примером источника персонального номера могут быть паспортные столы отделов милиции или отделы записи актов гражданского состояния.

Необходимым условием внутрисистемной уникальности персональных номеров на федеральном уровне является создание общегосударственного реестра источников персональных номеров. На основе комбинации кода источника и персонального номера гражданина, сформированного комплексом средств автоматизации нижнего уровня, должен быть сгенерирован персональный идентификационный номер гражданина.

При использовании невычисляемого персонального номера целостность системы баз данных о населении и однозначность идентификации граждан при актуализации и взаимодействии должны поддерживаться специализированными алгоритмами идентификации записей о гражданах и синхронизации их персональных номеров. Приведем конкретный жизненный пример, иллюстрирующий этот сложный вывод.

В современных автоматизированных системах, содержащих данные о населении, уникальный регистрационный номер записи о гражданине формируется, децентрализовано на основе внутрисистемных алгоритмов. При централизации данных на верхнем уровнем (например, в комплексе средств автоматизации субъекта Российской Федерации) могут быть найдены другие записи об этом гражданине, введенные ранее. При этом сначала необходимо идентифицировать эти записи, а затем синхронизировать регистрационный номер гражданина во всех записях.

Это не удается сделать при интеграции данных о населении нескольких субъектов федерации по причинам, независящим от корректности разработанных алгоритмов идентификации и синхронизации данных. Например, гражданин был зарегистрирован в паспортном столе отдела милиции и получил там уникальный регистрационный номер. Затем гражданин выбывает из Москвы в другой субъект федерации, там женится (меняет фамилию, имя или отчество), и, следовательно, документы, удостоверяющие личность, а затем вновь прибывает в Москву. При повторной регистрации такого гражданина не могут быть предложены какие-либо устойчивые формальные алгоритмы, обеспечивающие однозначную идентификацию.

Вычисляемый на основании биологических характеристик персональный идентификационный номер может быть сформирован как числовая свертка уникальных для каждого человека параметров, не меняющихся в течение его жизни, в качестве которых в современной практике обычно используются рисунок отпечатков пальцев или радужной оболочки глаза. Несмотря на очевидные преимущества данного подхода к формированию персонального номера (возможность при "предъявлении" самого человека без каких-либо документов однозначно вычислить его номер), на практике этот способ мало применим – такая процедура вычисления для всех жителей страны слишком дорогостояща и может вызвать психологический дискомфорт у граждан.

Одним из вариантов формирования вычисляемого персонального идентификационного номера гражданина на основе его юридических параметров, это использование комбинаций серий и номеров документов, удостоверяющих личность, фамилии, имени и отчества, даты рождения, места рождения. Несмотря на очевидные достоинства, этот вариант имеет существенный недостаток, связанный с изменением персонального идентификационного номера при смене документа, удостоверяющего личность. Этого можно избежать путем ведения единой базы данных документов, удостоверяющих личность, на территории Российской Федерации и централизованного учета расходования гербовых бланков документов. В связи с отсутствием такого учета и значительной стоимостью создания системы централизованного учета документов (эта стоимость сравнима с созданием АС ГРН России) вычисляемость персонального идентификационного номера гражданина, сформированного подобным способом, является условной.

Рассмотрим пример вычисляемого персонального идентификационного номера гражданина на основе данных юридического характера – неизменяемых в течение жизни человека реквизитов его актовой записи о рождении. Комбинация года рождения, номера актовой записи о рождении и кода места регистрации актовой записи гарантируют уникальность персонального кода. Необходимым условием уникальности является ведение общероссийского реестра мест регистрации актов гражданского состояния. На основе указанных данных персональный идентификационный номер гражданина может быть корректно вычислен любой автоматизированной системой.

Если обратиться к международной практике (Бельгия, Швейцария, Германия, Южная Корея), то в этих странах используется вычисляемый персональный идентификационный код, сформированный на основе данных о рождении.

5. Обоснование выбора реквизитов для формирования вычисляемого персонального идентификационного номера

Анализ, приведенный в предыдущем разделе, показывает, что работа с вычисляемым персональным идентификационным номером проста и эффективна на этапах генерации и актуализации записей о гражданах. Приведем обоснование выбора реквизитов гражданина, которые должны использоваться для формирования персонального идентификационного номера.

Сочетание фамилии, имени и отчества используются для идентификации граждан в повседневной практике. Однако эти реквизиты не пригодны для формирования вычисляемого идентификационного номера. Так, анализ базы данных “Учет избирателей” Москвы показал, что из 7 млн. избирателей 4 млн. избирателей не уникальны по комбинации фамилии, имени и отчества. Анализ базы данных МАИС “ЗАГС” по рождению граждан за период с 1992 по 1999 годы показал, что 32 процента граждан неуникальны по фамилии, имени и отчеству.

Для обеспечения уникальности к фамилии, имени и отчеству можно добавить дату рождения и место рождения. В отдельных концепциях делаются выводы об уникальности подобной комбинации реквизитов человека. Однако проведенные исследования показывают следующее.

За последние 10 лет в Москве по данным общегородской базы данных "ЗАГС" зафиксировано 134 случая регистрации рождения детей с неуникальным (в пределах имеющегося объема информации) сочетанием ФИО/дата рождения. Таким образом, в Москве вероятность ложной идентификации в случае использования комбинации ФИО, даты рождения и места рождения можно приблизительно оценить на уровне одной сотой процента.

Главной причиной, не позволяющей использовать персональный номер, в формировании которого участвует ФИО, заключается в том, что-либо фамилия, либо имя, либо отчество могут меняться в течение жизни человека. Например, по существующей традиции, значительная часть женщин при заключении брака берут фамилию мужа. Фамилия также может меняться при расторжении брака. Кроме того, в действующем законодательстве предусмотрена возможность перемены любого из составляющих ФИО на основании записи гражданского состояния о перемене имени. Например, в 1998 году в Москве, по тем или иным причинам, ФИО поменяли 46956 человек.

Следующие реквизиты, которые часто рассматривают в качестве основы персонального идентификационного номера – это реквизиты документа, удостоверяющего личность. Если составлять номер на основании серии и номера документа с добавлением кода его типа (например: паспорт, свидетельство о рождении, удостоверение личности военнослужащего и др.), то обеспечивается полная уникальность получаемого кода. Этим подобный вариант выгодно отличается от рассмотренных ранее. Другое важное преимущество способа формирования персонального номера на основании реквизитов документа, удостоверяющего личность, является то, что эти реквизиты доступны и общеприняты. Действительно, в большинстве случаев, когда какие-либо действия человека связаны с их регистрацией государственными организациями, предъявляется паспорт или документ, его заменяющий, и, соответственно, реквизиты этих документов обычно попадают в базы данных автоматизированных систем. Но у системы формирования персонального идентификационного номера на основании документа, удостоверяющего личность, есть тот же существенный недостаток, что и у рассмотренных ранее вариантов, а именно изменяемость реквизитов документа в течение жизни человека. У ребенка документ, удостоверяющий личность – это свидетельство о рождении, далее по достижении 14 лет он меняется на паспорт, который может в дальнейшем быть сменен на удостоверение личности военнослужащего, потерян, и т.д. При любой смене документа меняется сформированный на его основании номер. Избежать этого можно только путем ведения оперативно централизуемой общегосударственной базы документов, удостоверяющих личность, к которой все организации, нуждающиеся в вычислении уникального гражданского кода, будут иметь доступ за разумное время. Такая система достаточно сложна технически и требует для своей реализации существенных затрат.

Единственными данными, которые не могут измениться в течение жизни человека, являются данные о рождении. Таким образом, формирование персонального идентификационного номера на основании данных о рождении – единственный способ, который можно без всяких допущений назвать вычисляемым согласно приведенному выше определению.

Анализ технологий формирования персонального идентификационного номера, проведенный инженерно-внедренческим центром “ИНСОФТ”, показал, что единственными данными о рождении человека, которые могут с помощью простых алгоритмов сформировать абсолютно уникальный вычисляемый и неизменяемый персональный номер, являются реквизиты актовой записи о рождении.

Актовая запись о рождении однозначно идентифицируется с помощью следующих реквизитов: номер актовой записи, год регистрации, место регистрации. Подобная комбинация реквизитов выбрана потому, что каждый отдел ЗАГС в соответствии с Федеральным законом об актах гражданского состояния ведет нумерацию актовых записей в течение года для каждого акта гражданского состояния. В Управлении ЗАГС (отделе ЗАГС) субъекта Российской федерации имеется реестр отделов ЗАГС (пунктов регистрации актов гражданского состояния) за период с 1918 года по настоящее время. В случае если гражданин родился за границей, то в соответствии с действующим законодательством, регистрация акта о его рождении осуществляется зарубежными пунктами регистрации, к числу которых относятся консульские отделы посольств, генеральные консульства или бюро ЗАГС при военных комендатурах и т.д. Согласно сложившейся юридической практике реестр консульских пунктов регистрации ведется Управлением ЗАГС Московской области за период с 1918 по 1979 годы, Управление ЗАГС Москвы за период с 1979 года по настоящее время.

6. Технология формирования персонального идентификационного номера гражданина, использованная ИВЦ “Инсофт” в разработке Автоматизированного интегрированного банка данных “Население” Москвы

Основной идеями разработки являлись:

· Формирование вычисляемого персонального номера для граждан, рождение которых зарегистрировано в Москве за период с 1990 года по настоящее время;

· Поддержание невычисляемого персонального номера для других граждан.

Всего в разработанном персональном номере 17 разрядов. Структура вычисляемого персонального номера, генерируемая при интеграции с МАИС “ЗАГС”, имеет следующий вид - PTXXXXXWWYYYYZZZZ, где

· P - признак, указывающий на способ формирования номера (для данной формы, когда номер вычисляемый, P=1);

· T - тип подсистемы (акта гражданского состояния), на основе которой формируется данный код (T=1 - рождение, T=2 - восстановленное рождение);

· XXXXX - пятизначный номер актовой записи, на основе которой формируется гражданский код, причем незаполненные позиции слева заполняются нулями;

· WW - код субъекта РФ, на территории которого расположен отдел ЗАГС, зарегистрировавший актовую запись, на основе которой формируется гражданский код;

· YYYY - код отдела ЗАГС, зарегистрировавшего актовую запись, на основе которой формируется гражданский код;

· ZZZZ - год регистрации актовой записи, на основе которой формируется гражданский код.

Пример корректно сгенерированного вычисляемого кода: 11012457702001996.

Данный код означает, что генерация записи и формирование данного вычисляемого (P=1) уникального гражданского кода произведены на основании актовой записи о рождении (T=1) номер 1245 (XXXXX=01245), зарегистрированной в 1996 году (ZZZZ=1996) в Медведковском отделе ЗАГС (YYYY=0200) г. Москвы (WW=77).

Для формирования вычисляемого уникального гражданского кода используются два классификатора – классификатор субъектов РФ и классификатор отделов ЗАГС на территории каждого субъекта федерации. Классификаторы отделов ЗАГС для субъектов РФ, в которых внедрена МАИС “ЗАГС”, созданы и ведутся ИВЦ “ИНСОФТ”. В частности, имеется полный классификатор органов ЗАГС г. Москвы с учетом переименований с 1918 года.

Для записей, включаемых в реестр населения, в отношении которых вычисляемый персональный номер не может быть сформирован на основе информации, содержащейся к настоящему моменту в фонде объединенного архива ЗАГС, формируется невычисляемый номер, имеющий вид PYYXXXXXXXXXXXXXX, где

· P - признак, указывающий на способ формирования кода (невычисляемый - P=0);

· YY - код автоматизированной системы, на основании данных которой сформирован код, присвоенный данному лицу;

· XXXXXXXXXXXXXX - номер, присваиваемый данному гражданину системой, причем свободные позиции слева заполняются нулями. Каждая автоматизированная система, присваивающая подобный невычисляемый номер, может его структурировать, например, разделяя его на порядковый номер и код места формирования.

Пример корректно сгенерированного невычисляемого кода: 00177031201001234.

Данный номер означает, что формирование невычисляемого (P=0) персонального номера произведено АИБД “Население” (YY=01) в г. Москве (77) на территории паспортного стола № 1 района Гольяново (031201), а порядковый номер записи 1234 (001234).

Таким образом, обе формы номера занимают одинаковое количество разрядов (17) и легко различаются на основании первого разряда. Большая разрядность кода может показаться избыточной, но за счет нее появляются несомненные преимущества.

· Возможность формирования как вычисляемого, так и невычисляемого номера, первичное присвоение персонального номера различными автоматизированными системами.

· Решение “проблемы 2000”.

· Введение избыточности, обеспечивающей системе формирования номера достаточный “запас прочности” на случай, например, неожиданно бурного прироста населения.

Отсутствие запаса номеров может весьма пагубно сказаться на системе присвоения персонального номера. В качестве примера системы присвоения кодов, рассчитанной без запаса, можно привести систему выдачи государственных номерных знаков на автомобили. Для Москвы разрядности автомобильного номера с предыдущего года стало не хватать, и вместо номеров “77” в городе стали выдавать номера “99”, нарушив, таким образом, принятую систему привязки номера к коду субъекта федерации.

Кроме того, 17 разрядов данного варианта гражданского кода (1 бинарный признак формы кода и 16 десятичных разрядов) при записи в двоичном виде занимают всего 7 байт, что в сравнении с прочей информацией о гражданах, хранящейся в базах данных о населении, составляет весьма небольшой процент.

7. Использования уникального гражданского кода в рамках АИБД “Население” г. Москвы

АИБД “Население” г. Москвы изначально проектировалась как многоуровневая распределенная автоматизированная система с развитой нормализованной реляционной моделью данных, все записи в которой идентифицируются с помощью первичных ключей. ER-диаграмма реляционной модели данных АИБД “Население” приведена на рисунке 1.

 

Рисунок 1. ER-диаграмма реляционной модели данных АИБД “Население”.

В числе основных таблиц модели – таблица данных о жителях, содержащая информацию, относящуюся непосредственно к жителям, а не к другим сущностям, выделенным при построении модели (например, “Объект жилого фонда”, “Документ” и т.д.). Схема атрибутов таблицы “Данные о жителях” приведена на рисунке 2.

Рисунок 2. Схема таблицы “Данные о жителях”.

Первичный ключ таблицы данных о жителях для удобства дальнейшего изложения будем называть “системный код жителя”. Кроме системного кода жителя, в числе атрибутов рассматриваемой таблицы присутствует уникальный гражданский код жителя, являющийся внешним ключом, ссылающимся на атрибут “системный код жителя” той же таблицы. Необходимость такой системы ключей вызвана тем, что в таблице “Данные о жителях” учитывается не только текущее ФИО человека, но и история его перемены. Таким образом, с помощью системного кода жителя однозначно идентифицируется его ФИО в любом временном интервале, а с помощью уникального гражданского кода (значение этого атрибута, естественно, одинаково у всех записей по разным ФИО одного человека) это ФИО отождествляется с самим человеком. Для записей об актуальном ФИО человека значение системного кода жителя равно значению уникального кода, для предыдущих состояний ФИО оно отрицательно.

Рассмотрим подробнее структуру и механизмы формирования системного и уникального кода жителя. Уникальный код жителя формируется в полном соответствии с описанной в предыдущем разделе разработкой ИВЦ “ИНСОФТ”. Формируется вычисляемый гражданский код для записей, по которым он может быть сформирован, и невычисляемый для всех прочих. Структура невычисляемой формы кода уточнена по сравнению с приведенной в предыдущем разделе. Напомним, что общий вид структуры невычисляемой формы гражданского кода, разработанной ИВЦ “ИНСОФТ”, следующий:

PYYXXXXXXXXXXXXXX, где P - признак, указывающий на способ формирования кода (невычисляемый - P=0); YY - код автоматизированной системы, на основании данных которой сформирован код, присвоенный данному лицу; XXXXXXXXXXXXXX - номер, присваиваемый данному гражданину системой. Для АИБД “Население” поле YY имеет значение 01. Поле XXXXXXXXXXXXXX дополнительно структурируется и имеет вид: WWSSSSSSNNNNNN, где

· WW - код субъекта РФ, на территории которого расположен паспортный стол, присвоивший гражданский код;

· SSSSSS - код паспортного стола, присвоившего гражданский код;

· NNNNNN – порядковый номер в пределах паспортного стола, присвоившего гражданский код.

То есть, невычисляемая форма гражданского кода, присваиваемая АИБД “Население”, имеет следующий общий вид: PYYWWSSSSSSNNNNNN (поля описаны выше, пример приведен в предыдущем разделе).

Как уже было сказано выше, для записей об актуальном ФИО человека значение системного кода жителя равно значению его уникального кода, и, соответственно, структура системного кода таких записей соответствует описанной структуре уникального кода. Для записей о неактуальном состоянии ФИО структура системного кода соответствует структуре невычисляемой формы уникального кода с добавлением знака “минус” в начале.

При попадании в систему “Население” нижнего уровня какой-либо новой информации из сторонних систем (а это основной источник ее поступления), в которых не применяется уникальный гражданский код, например, из автоматизированных систем паспортного учета ДЕЗ, автоматически находятся уникальный и системный коды человека, о котором поступила информация, либо создаются новые коды, если ранее этот человек не был учтен в базе данного паспортного стола. Вся последующая обработка информации ведется с применением полученных кодов. Для получения уникального и системного кодов человека используются алгоритмы автоматической идентификации личности, описанные в следующем разделе.

Так как АИБД “Население” - многоуровневая распределенная система, то в ней для актуализации баз данных верхних уровней используются механизмы обмена данными между уровнями системы. Потоки данных в системе идут в двух направлениях – как “снизу-вверх” (основной поток, содержит порцию информации, вновь введенной или модифицированной с момента формирования предыдущей порции), так и “сверху вниз” (вспомогательный поток, содержит подтверждение об обработке основного потока и сообщения о необходимости смены кодов, описанные ниже). Полный цикл обмена информацией между базами нижнего и верхнего уровня состоит из одной порции информации, переданной “снизу-вверх”, и одной, переданной “сверху вниз”. Для паспортных столов, не связанных линиями телекоммуникации с центральной базой, процесс обмена информацией между уровнями системы разделен с процессом ввода информации в систему нижнего уровня, и полный цикл обмена с базой верхнего уровня достигает недели при непрекращающемся вводе. В процессе обмена данными между уровнями для идентификации записей, естественно, используются первичные ключи таблиц, и, соответственно, для таблицы данных о жителях это системный (и уникальный) код жителя. То есть, любое внутрисистемное взаимодействие в АИБД “Население” происходит с использованием уникального гражданского кода.

При вводе информации в базу данных какого-либо паспортного стола нижнего уровня АИБД “Население” возможна ситуация, когда в базе данного паспортного стола (в дальнейшем паспортный стол “2”) человек не зарегистрирован, но информация о нем имеется в другом паспортном столе (паспортный стол “1”), и, соответственно, в базе данных верхнего уровня системы. Тогда, если нет линий телекоммуникации между паспортным столом “2” и базой верхнего уровня, один и тот же человек будет в разных паспортных стола учтен под разным кодом. В АИБД “Население” эта проблема решается следующим образом: при актуализации базы данных верхнего уровня (обработке потока “снизу-вверх”) в результате работы алгоритмов идентификации личности подобные случаи выявляются, и для записей о человеке, пришедших из паспортного стола “2”, системный и уникальный коды меняются на коды, присвоенные тому же человеку в паспортном столе “1”. Информация о смене кодов включается в поток “сверху вниз” и после его обработки в паспортном столе “2” восстанавливается однозначное соответствие кода человеку во всех базах АИБД “Население”.

Как уже было сказано выше, для всех записей о жителях, для которых это, возможно, формируется вычисляемый гражданский код. Необходимая для формирования вычисляемого кода информация (номер актовой записи о рождении, год регистрации и код отдела ЗАГС) попадает в АИБД “Население” в процессе взаимодействия с МАИС “ЗАГС”. Разработан интерфейс информационного взаимодействия этих систем, позволяющий своевременно получать и обрабатывать технологическими процедурами АИБД “Население” журнальные файлы, выработанные МАИС “ЗАГС” на основании актовых записей о рождении, с занесением информации о реквизитах соответствующих актовых записей в базы данных паспортных столов. В процессе обработки журналов информационного взаимодействия используются алгоритмы идентификации личности, описанные в следующем разделе.

8. Технология автоматической идентификации граждан при отсутствии персонального идентификационного номера

При поэтапном внедрении персонального идентификационного номера на начальных этапах не удастся обеспечить его обязательную запись во все документы, удостоверяющие личность. В таком случае, как уже упоминалось выше, при использовании невычисляемого персонального номера, а также при использовании вычисляемого номера, но в случае отсутствия данных для его вычисления в отдельных комплексах средств автоматизации, необходимо использовать механизмы идентификации личности по комбинациям параметров, не всегда дающим возможности сформировать персональный номер. Под идентификацией личности в данном разделе будем понимать нахождение уникального гражданского кода человека – в понятии, принятом в АИБД “Население”, данные о котором, поступают в систему. В случае ненахождения этого кода система должна сгенерировать его сама. Для идентификации личности используется информация локальной базы данных автоматизированной системы, а также данные тех систем, к которым имеется оперативный (on-line) доступ.

Наиболее просто проблема идентификации личности решается в тех системах, которые имеют доступ к полным данным обо всех документах, удостоверяющих личность, в масштабе всей страны. Подобные данные позволяют сформировать первичный идентификационный код, и дальнейшая однозначная идентификация личности не представляет проблемы. К сожалению, авторам не известна ни одна система, которая может выдать информацию обо всех документах, удостоверяющих личность, в масштабе страны.

В реальности приходится применять более сложные и дающие не всегда стопроцентный результат алгоритмы идентификации. Рассмотрим, например, методы идентификации личности в АИБД “Население” г. Москвы. Разработанные алгоритмы идентификации многостадийны и используют различные комбинации параметров. В число параметров, используемых для идентификации, включается комбинация ФИО и даты рождения гражданина. Естественно, это уменьшает вероятность успешной идентификации за счет того, что может произойти перемена ФИО человека, но наличие полных данных МАИС “ЗАГС” по г. Москве за почти десятилетний период практически сводит на нет данную проблему.

Исходя из уникальности комбинации кода вида документа, удостоверяющего личность, его серии и номера, на первом этапе идентификации происходит сравнение паспортных данных человека, информация о котором поступает в систему, с данными документов, находившихся в системе ранее. В случае нахождения такой же комбинации в базе данных проверяется ФИО и дата рождения. Их несовпадение с имеющимися в базе данными сигнализирует об ошибках при первичном вводе информации, и инициирует исправление ситуации организационными методами, а именно путем запроса корректности данных в организациях, которые осуществили первичный ввод данных об этом человеке. Полное же совпадение комбинации реквизитов документа, ФИО и даты рождения приводит к окончанию работы процедуры идентификации и успешному получению уникального гражданского кода. Возможность перемены ФИО на данном этапе не учитывается, так как перемена ФИО всегда сопровождается сменой документа, удостоверяющего личность.

Поскольку АИБД “Население” г. Москвы – распределенная многоуровневая система, фиксирующая, в частности, перемену места жительства граждан, то следующий этап идентификации – проверка на совпадение комбинации ФИО - дата рождения и места жительства (или пары предыдущий/последующий адрес места жительства в случае переезда). В случае переезда человека в пределах одного паспортного стола или с территории одного паспортного стола на территорию другого (если в обоих внедрен АИБД “Население”, в дальнейшем – “автоматизированный паспортный стол”), то в записи по предыдущему месту жительства фиксируется адрес последующего, а в записи по новому месту жительства имеются данные о предыдущем. Вероятность того, что по одному и тому же адресу будут проживать два и более человека с одинаковой комбинацией ФИО – дата рождения настолько мала, что в описываемом алгоритме идентификации такая возможность не рассматривается. В начале данного этапа процедуры идентификации проводится проверка всех подсистем МАИС “ЗАГС”, фиксирующих случаи перемены ФИО, на предмет выявления предыдущих (или последующих) вариантов ФИО данного человека, и описанный выше алгоритм отрабатывает для всех найденных вариантов.

Если уникальный код человека не найден на двух предыдущих этапах идентификации, то задействуется последний этап – сравнение ФИО, даты рождения и описания места рождения. Это возможно в случаях переезда человека вначале с территории одного автоматизированного паспортного стола на территорию неавтоматизированного (в частности, за пределы Москвы), смены документа, и последующего переезда на территорию другого автоматизированного паспортного стола. Возможность смены ФИО учитывается так же, как и на предыдущем этапе. Сравнение ФИО, даты и места рождения, к сожалению, не полностью исключает возможность ложной идентификации и существует, хоть и небольшая, вероятность того, что два разных человека получат одинаковый гражданский код (количественные данные приведены ранее). Но по мере расширения зоны охвата системы, подобной АИБД “Население”, такие случаи будут обнаруживаться специальной технологической процедурой, и людям, получивших неуникальный код, будет присваиваться новый код. Суть этой процедуры – обнаружение случаев прописки человека (под человеком в данном случае понимается одно и то же значение кода) по двум и более местам одновременно. Нахождение такого случая – сигнал к тому, что данный человек не был выписан с предыдущего места жительства, либо произошла ложная идентификация. Выяснение, что же произошло конкретно, производится путем запроса соответствующих паспортных столов с последующим исправлением ситуации. Таким образом, на момент принятия решения о записи уникального гражданского кода в документы, удостоверяющие личность, всем жителям страны (если такое решение будет принято), в случае повсеместного внедрения системы с подобными алгоритмами идентификации личности, после проведения всех описанных технологических и организационных мероприятий последствия всех случаев ложной идентификации будут устранены.

Единственная возможность неуспешной идентификации по описанному выше алгоритму имеется в том случае, когда человек выехал с территории автоматизированного паспортного стола на территорию неавтоматизированного, изменил там ФИО, информация о чем не попала в электронные архивы органов ЗАГС (это возможно при переезде за пределы Москвы), и вновь переехал на территорию автоматизированного паспортного стола. В этом случае гражданин будет зарегистрирован в системе под двумя различными кодами. Подобные ситуации будут обнаруживаться по мере внедрения системы на новых территориях, и случаи повторного присвоения кода будут исправляться.

Этапность алгоритма идентификации личности, реализованного в АИБД “Население”, несколько условна и четкое разделение этапов произведено лишь для удобства изложения. Естественно, программно реализован однократный поиск данных о людях с таким же ФИО для всех описанных этапов; при этом выбираются прочие данные, необходимые для идентификации. Так что с использованием мощных средств поиска информации СУБД ORACLE работа процедур идентификации для недельной порции информации, приходящей из одного московского паспортного стола, занимает считанные секунды.

Как видно из приведенного описания, алгоритмы идентификации личности, используемые в АИБД “Население”, при повсеместном внедрении гарантируют вероятность корректной идентификации, пренебрежительно мало отличающейся от стопроцентной, при условии корректности исходных данных. К сожалению, это условие не всегда выполняется. Наибольшее число ошибок и неточностей встречается в написании места рождения, начиная от синтаксических ошибок и кончая внесением в разные документы и, соответственно, в базы данных, различных наименований населенных пунктов, претерпевавших переименование. Например, у человека, в свидетельстве, о рождении которого записано место рождения город Сталинград, может в паспорте быть записано место рождения город Волгоград. Проблемы таких несоответствий решаются с помощью введения справочников альтернативных наименований, учитывающих исторические названия. Синтаксические ошибки устраняются схожим методом – с помощью ведения таблиц соответствия, в которые автоматически по приходе каждой порции информации заносятся отсутствующие ранее в таблице и в справочнике способы написания населенных пунктов, а далее полуавтоматическими методами в соответствие им ставится написание по справочнику. Для выявления и устранения ошибок в написании ФИО, даты рождения и реквизитов документов, удостоверяющих личность, разрабатываются алгоритмы выявления схожих записей с целью последующего выяснения корректного написания. Кроме того, в системе при загрузке информации применяются такие тривиальные методы автоматической нормализации информации, как перевод схожих по написанию с русскими латинских букв в написании ФИО и названий населенных пунктов, нормализация написания серии документов и т.д. Применение вышеописанных механизмов коррекции позволяет рассчитывать, что в случае необходимости записи уникального гражданского кода в документы, удостоверяющие личность, количество неидентифицированных записей не превысит одного процента. Эти записи впоследствии могут быть выявлены и исправлены в процессе повсеместной записи уникального гражданского кода в документы, удостоверяющие личность, за счет того, что они не описывают никаких реальных людей и документов.

Заключение

Задача идентификации личности стоит перед человеческим сообществом с древнейших времен. Можно попытаться рассмотреть развитие способов ее решения в исторической перспективе.

Вначале, когда сообщества, в пределах которых решалась задача идентификации личности, были невелики, для целей идентификации людям стали присваивать имена. Впоследствии, при увеличении размеров социальных образований, система имен потеряла уникальность. К именам стали добавлять различные модификаторы на основании рода деятельности, имен родителей и т.д. Так появились фамилии и отчества. Но и комбинация фамилии, имени и отчества со временем перестала уникально идентифицировать человека. В результате развития общества появилось понятие документа, удостоверяющего личность. В настоящее время документы, удостоверяющие личность, обладают уникальной комбинацией реквизитов. Уникальность комбинации реквизитов позволяет на основании документа однозначно идентифицировать личность. Во многих странах, например, в России, Франции и т.д., это единственный способ идентификации.

Но существует ряд трудностей, возникающих на практике при использовании реквизитов документов для идентификации личности. В первую очередь это сменяемость документов в течение жизни человека.

По мнению авторов статьи, более прогрессивный метод идентификации личности – использование персонального идентификационного номера.

Задача идентификации личности является одной из основных при интеграции данных автоматизированных систем учета населения. Использованию для ее решения персонального идентификационного номера посвящена данная статья. Юридические, организационные и экономические аспекты введения персонального идентификационного номера гражданина в статье не затронуты.

Адрес для переписки. ev@insoft.ru