Big Data. Зачем экономике нужны Большие данные?

Термин «Большие данные» (Big Data) появился в 2008 году. С тех пор было дано множество его определений. Объединяет их следующее: Большие данные имеют настолько значительный объём, скорость прироста, сложную внутреннюю структуру и взаимосвязи, что их обработка с помощью традиционных методов затруднена или невозможна. 

Data Science — это наука о данных, которая объединяет в себе математику, статистику, программирование, аналитику и знание предметной области (экономика, медицина, спорт, физика и т.д.). Специалисты в этой области работают с большими объемами данных (Большие данные), чтобы находить закономерности, строить прогнозы и для поиска наиболее оптимального решения.

Большие данные создаем все мы: повседневно совершая покупки в интернете и магазинах, ставя лайк в социальных сетях, играя на бирже, посещая поликлиники, пользуясь услугами транспорта и сотовых операторов. Агрегируя эти данные и применяя различные математические и статистические методы строятся автоматизированные модели, которые помогают принимать управленческие решения. Например: выдавать ли кредит на основе данных о кредитной истории клиентов, их доходах и расходах; инвестировать ли в то или иное направление; выписать ли данный набор лекарств с учетом истории болезни больного; как персонализировать предложения для своих клиентов; как построить наиболее оптимальные логистические маршруты; как оптимизировать производство и распределение энергоресурсов и прочее.

В сообществе Большие данные принято характеризовать с помощью 5 V:

  • Velocity (скорость) - это скорость, с которой создаются данные, и скорость их перемещения.
  • Volume (объем) - это объем данных, которые можно отнести к большим данным.
  • Value (ценность) - это значимость, которую предоставляют данные.
  • Variety (разнообразие - это разнообразие типов данных.
  • Veracity (достоверность) - это качество и точность данных.

Почему Data Science так важен?

Данные — это новая нефть.
Ежедневно генерируемые огромные объемы информации компании хотят использовать для улучшения своих продуктов и услуг, и здесь на помощь приходят data scientist'ы. По сведениям компании Gartner из-за необработанных данных бизнес ежегодно теряет в среднем 12,9 млн. долл. прибыли, а исследование QuantHub показывает, что рост генерации данных происходит с экспоненциальной скоростью. Такой рост подтверждает заявление о том, что компании продолжат искать способы преобразования данных для получения прибыли, а значит будет расти потребность в их аналитике.

Искусственный интеллект и машинное обучение.

Искусственный интеллект (далее – ИИ) активнее входит в нашу жизнь. Специалисты Data Science занимаются процессами, лежащими в основе разработки алгоритмов машинного обучения и ИИ, которые используются в медицине, финансах, логистике и даже искусстве.MIT Sloan Management Review отмечает: большинство руководителей технологических компаний считают, что взаимодействующие друг с другом программы ИИ будут в первую очередь основаны на специализированных генеративных ботах, выполняющие конкретные задачи. В 2024 году 37% опрошенных заявили, что работают в организации, основанной на данных и ИИ, а 33% заявили, что у них уже есть культура, основанная на данных и ИИ.

Автоматизация процессов.
Бизнес стремится автоматизировать рутинные задачи, и Data Science помогает создавать системы, которые могут анализировать данные и принимать решения. С 2020 года число вакансий в области аналитики данных увеличилось почти в 10 раз (по данным НН и Mail.ru Group).
Подтверждением важности направления Data Science в России стало начало реализации с 2025 года Национального проекта «Экономика данных», который является продолжением пути цифрового развития страны. Нацпроект направлен на цифровизацию отраслей экономики и социальной сферы, достижение технологического суверенитета и лидерства. В рамках проекта запланированы мероприятия по разработке и внедрению решений на базе ИИ, подготовка соответствующих специалистов, цифровизация государственных услуг, переход на отечественные цифровые технологии и др.

Заменит ли ИИ специалиста в области Data Science?

В последнее время в новостях всё чаше появляется информация о том, что из-за внедрения ИИ сотрудники организаций лишаются своих мест. Это правда для работников, выполняющих стандартные, повторяющиеся, конкретные задачи. Но касается ли это data scientist’ов?
Несмотря на то, что ИИ может быстрее обрабатывать данные, он имеет ряд ограничений:
  • системы ИИ не обладают способностью к критическому мышлению — они работают на основе заданных правил и алгоритмов;
  • качество работы ИИ напрямую зависит от качества исходных данных — если данные содержат ошибки, результаты будут ненадежными;
  • ограниченные творческие способности — ИИ не способен проявлять креативность в той же степени, что и человек;
  • этические аспекты и ответственность — последствия за принятые решения ИИ несет человек.
Специалисты по Data Science играют ключевую роль в анализе данных, поскольку обладают навыками и знаниями, выходящими за рамки простого программирования и обработки данных. Эти специалисты умеют ставить и решать комплексные задачи, интерпретировать результаты, принимать решения и взаимодействовать с другими специалистами и руководителями компании.

Итог

Data Science — это не просто модное направление, а профессия, которая будет определять будущее технологий и бизнеса. Если вы хотите быть на волне успеха, сейчас самое время начать изучать эту сферу и поступить на программы Специального факультета талантливой молодежи «Форсайт» РЭУ им. Г.В. Плеханова.

Факультет является участником государственной программы поддержки университетов «Приоритет 2030» в рамках Национальных проектов РФ. В 2024 году мы были признаны "Лучшей практикой кооперации" среди 85 вузов - учатсников программы.

На Факультете реализуются две программы бакалавриата и две программы магистратуры, связанные с применением технологий Data Science в экономике и ИТ по направлениям: «Экономика», «Прикладная математика и информатика», «Прикладная информатика». Мы готовим:
  • экономистов, аналитиков, будущих руководителей, владеющих современными экономико-математическими и ИТ-методами работы с Большими данными;
  • системных программистов, умеющих строить математические модели для решения сложных задач, разрабатывать программное обеспечение, применять машинное обучение и искусственный интеллект.
Наши выпускники смогут использовать IT-технологии, одновременно хорошо разбираясь в своей предметной области. Они будут Data Scientist, постановщиками социально-экономических задач – связующим звеном между Экономикой и IT – представителями наиболее редкой, наиболее востребованной и наиболее высокооплачиваемой профессии.

Усиленные программы, ведущие ученые и практики мирового уровня, выделенная образовательная среда, индивидуальный подход – всё это ждёт будущих студентов «Форсайт».

Интервью директора Объединенного института ядерных исследований в Дубне

Академик РАН, д-р физ.-мат. наук, генеральный директор Объединенного института ядерных исследований в Дубне Григорий Владимирович Трубников рассказал в цикле интервью «Ъ» «Директора» о мегасайнс-проекте «Ника», гетерогенных компьютерных системах и математических моделях, которые помогали в борьбе с COVID-19, применении облучения в медицине и профессии ученого.

ОИЯИ в г. Дубна: научный центр мирового уровня - партнер Специального Факультета талантливой молодежи "Высшая школа Форсайт".
Полная версия интервью: https://www.kommersant.ru/doc/5608815

Разговор о науке. Анализ данных в экономике. Зачем это нужно?