Управление на данни Vs Data Science

- Здравей, Чичи. Приятно ми е да се запознаем. Та какво правиш?"

С най-добрата ми усмивка „Аз съм мениджър на данни“.

Със объркана усмивка „Ерм… какво означава това?“

**********************

Тъй като Данните станаха много популярни, мога да се обзаложа (въпреки че не залагам), че сигурно сте чували за ролята на Data Scientist. Ако не разбирате съвсем какво е, внимавайте за публикацията ми за някои ключови професии с данни. От друга страна, ролята на Data Manager е рядка. И така, какво всъщност е?

В широк смисъл управлението е координацията на хората и / или дейности за постигане на някаква цел (и). По подобен начин е управлението на данни

„Координацията на хора, процеси и потоци от данни, за да се постигнат определени зададени цели, които трябва да включват или да доведат до извличане на стойност от данните.“

Бегло погледът към това определение може да нарисува картина на управлението на данни като просто управление на данните. Истината е, че управлението на данни е много управление на данни, но много повече. Органът за управление на данни определя управлението на данни като

„Разработването, изпълнението и надзора на планове, политики, програми и практики за предоставяне, контрол, защита и повишаване на стойността на данните и информационните активи през целия им жизнен цикъл.“

Дейностите по управление на данни варират от технически като инженеринг на данни до нетехнически като управление на данните. Органът за управление на данни определя 11 области на знанието, които обхващат:

  • Архитектура и моделиране
  • Съхранение и операции
  • Сигурност
  • Основни данни, референтни данни, управление на документи, съдържание и метаданни
  • Интеграция и оперативна съвместимост
  • Складиране и бизнес разузнаване
  • качество
  • управление

И така, „къде е Data Science?“, Може да попитате. (Ако нямате нищо против хумор, това е в глава 14 на второто издание на тялото на знанието.)

Data Science е анализът и визуализацията на големите данни. Това е специфична техническа роля, която се основава на прилагането на няколко области на знанието за управление на данни.

Нека да станем малко по-практични.

Data Scientist се занимава основно с това да види какво е възможно с конкретен голям набор от данни. Data Scientist трябва да намери прозрения и отговори на въпроси, които не са били предварително определени (за разлика от анализатора, който изследва как да отговори на някои известни бизнес въпроси с данни). Междувременно, Мениджърът на данни се занимава с цялата информация за предприятието / отдела / домейна, а не само за конкретен набор от данни. Мениджърът се занимава с поддържането на целостта на данните през целия си жизнен цикъл и гарантира, че могат да бъдат достъпни ефективно от тези, които се нуждаят от използването им. Тази роля на данни изисква остро осъзнаване на бизнес целите, както и какво трябва да се направи от техническа страна.

А сега, нека да станем малко по-реалистични!

Дилемата на специалистите по данни е, че линиите между ролите се размиват още повече, но необходимостта от дълбочина в определени области е едновременно при поискване. Ако искате да бъдете по-ценен мениджър на данни, трябва да имате повече от основно ниво на опит в Data Science. По същия начин, перспективният учен с данни не трябва да се гордее само със статистически и алгоритмични умения, а трябва да мисли за данните като за живо същество, преминаващо през цикъл, и това трябва да се управлява.

********************

И така, какво да правя?

Помагам на организациите да придобият стойност, като разработват, изпълняват и контролират стратегии, политики, процеси и проекти, които придобиват, подобряват и използват данни и осигуряват лесен бъдещ достъп до тях. Ако данните са големи и има нужда от машинно обучение, не се колебая да обуча моделите!