СТА №2/2017

зирования и точность аналитических отчётов. Что касается промышленных пред- приятий, то основной «виновницей» появления большого количества ин- формации является интеграция. Сейчас на любом промышленном предприятии идут по пути интеграции всех имею- щихся систем автоматизации производ- ственных процессов в единую среду. Основное технологическое оборудова- ние, вспомогательные агрегаты, систе- мы собственных нужд и даже админи- стративные процессы внутри предприя- тия становятся источниками потоков данных. В качестве данных здесь фигу- рируют, конечно же, все технологиче- ские параметры, к ним добавляются данные из журналов учёта и эксплуата- ции оборудования, информация о про- ведении плановых и внеплановых ре- монтных работ, расследовании аварий и происшествий, логистические показа- тели, сведения о взаимодействии со структурными подразделениями, по- ставщиками сырья и энергоносителей. Здесь наблюдаем то же положение: чем больше охват и глубина проникновения в функциональную среду предприятия, тем проще будет строить зависимости и находить новые пути оптимизации про- изводства. Но есть на этом пути и нюан- сы. Например, анализ данных порожда- ет новые данные, и процесс этот может быть почти бесконечным. Также следу- ет принять во внимание, что для каче- ственного анализа данных, кроме самих алгоритмов и программного обеспече- ния, требуются серьёзные вычисли- тельные ресурсы. Когда речь идёт о больших данных, то их характеризуют пять основных при- знаков: ● Объём данных. Например, тепловая электростанция с двумя энергоблока- ми общей мощностью 450 МВт имеет объём 70 000 сигналов ввода-вывода по всем системам автоматизации ос- новного и вспомогательного оборудо- вания, которые, в свою очередь, еже- суточно увеличивают объём «сырых» данных на десятки гигабайт. Сигналы от газовых и паровых турбин (рис. 2) формируют относительно небольшой пакет данных, но по причине скоро- сти физических процессов эти дан- ные могут меняться с очень высокой частотой, что также ведёт к очень большому трафику, например, дан- ные виброконтроля оборудования. ● Скорость передачи данных. Любое предприятие, производящее техниче- ски сложные изделия, проводит ис- пытания этих изделий, и если взять, например, авиационный двигатель, то при работе на испытательном стенде в течение всего получаса может быть сформирован объём в десятки тера- байт информации. Чтобы её передать, требуются надёжные и высокоско- ростные каналы передачи данных. ● Разнообразие данных. Насколько раз- нообразен парк оборудования, на- сколько широко охватывает про- изводство разные технологические отрасли, настолько многообразны па- раметры, с которыми приходится ра- ботать при анализе больших данных. Возвращаясь к тепловым электро- станциям, можно отметить необходи- мость контроля химического состава в процессах водоподготовки, физиче- ских свойств теплоносителя и меха- нических свойств оборудования, а также процессов, протекающих в электроустановках преобразования и передачи электрической энергии. ● Достоверность. Важно, чтобы полу- чаемые данные имели достаточную точность, от которой зависит пра- вильность принятия решений. ● Ценность. За организацией каждого информационного канала стоят определённые затраты, и, конечно, если получаемая информация не име- ет никакой пользы, то можно смело считать, что это неэффективное ис- пользование ресурсов. Но нужно быть очень осторожным и случайно не избавиться от тех данных, которые косвенно могут принести значитель- ную пользу. И тут на помощь придут алгоритмы, которые могут исследо- вать скрытые зависимости в уже со- бранных данных и предоставить опе- ратору возможность определиться с необходимостью дальнейшего ис- пользования источников данных. А РХИТЕКТУРНЫЕ РЕШЕНИЯ ДЛЯ БОЛЬШИХ ДАННЫХ На первый взгляд, для обработки большого количества данных нужно всего лишь увеличить пропускную спо- собность каналов передачи данных, по- высить объём хранилищ и, конечно, на- растить вычислительную мощность процессоров. Но тут возникают множе- ственные ограничения, как техническо- го характера, так и физического уровня. Например, увеличивать частоту работы канала передачи данных выше опреде- лённого физического предела не полу- чается, следовательно, разработчики применяют методы распараллеливания потоков данных. То же самое происхо- дит и с делением вычислительной мощ- ности. Но конечный пользователь не должен видеть всей сложности органи- зационной структуры, и на помощь приходит кластерный метод построе- ния систем. Представление вычисли- тельной системы как единого целого значительно упрощает работу пользова- теля, но повышает сложность инфра- структурных решений. Однако наличие совершенно одинаковых составных элементов в структуре кластера позво- ляет легко увеличивать количество этих элементов и наращивать тем самым производительность системы в целом. У пользователя появляется возмож- ность запускать свои задачи в общей среде и динамически выбирать для них выделяемые вычислительные мощно- сти. Например, если существует сервер ОБ ЗОР / Т Е Х НОЛОГ ИИ 19 СТА 2/2017 www.cta.ru Рис. 2. Паровая турбина © arogant / depositphotos

RkJQdWJsaXNoZXIy MTQ4NjUy