С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK
Регистрация

Професия: Статистик

Мартин Димов, директор "Анализ на данни" в Gemseek, пред "Кариери"
Share Tweet Share
Снимка

 Фотограф: Велко Ангелов

Мартин Димов е директор "Анализ на данни" в компанията за маркетингови проучвания Gemseek. Той притежава докторска степен по статистика и демография от Оксфордския университет. Има 18-годишен професионален опит в пазарните проучвания, извадковите изследвания, статистическия анализ, машинното обучение и управлението на проекти. Неговият опит включва прилагането на математически методи при обработката на данни (data science), моделиране на продажбите, CRM анализи, потребителска сегментация и др.

Мартин има опит и в анализирането на данни в различни индустрии и задълбочени познания в областта на бизнес анализа. Някои от тях са прогнозиране и моделиране на продажбите, визуализация на данни и съвременни методи за събиране и оптимизация на маркетингова информация. Ръководи екип от специалисти в областта на математическата обработка на данни. Някои от основните дейности на неговия екип включват комбинирането на различни източници на информация от представителни проучвания, вътрешнофирмена финансова статистика, както и индивидуални данни за клиентите, които са неизменна част от анализа и прогнозирането на различни видове бизнес показатели (KPIs). Неговите последни проучвания са в областта на изграждането на съвременни полуавтоматизирани аналитични продукти, базирани на изкуствен интелект и инструменти за интерактивна визуализация на данни.

Мартин Димов ще бъде и сред участниците на предстоящия кариерен форум за българи с образование и опит в чужбина "Кариера в България. Защо не?", на който "Кариери" е медиен партньор. Той се организира за 11-та поредна година от сдружение "Тук-там" и Back2BG.com и ще се проведе на 20 септември 2018 г. в Интер Експо Център в София. Тази година в изложението се включва над 90 водещи компании, които предоставят възможности за професионална реализация в България. Присъствието е безплатно, но е нужна предварителна регистрация със CV или LinkedIn профил на този адрес. Повече за инициативата и програмата на събитието може да намерите тук.

Моята работа
В момента съм директор на отдел Data Science (Анализ на данни) към Gemseek. Ръководя 12 души с различен опит в областта на data science (съжалявам за английския, но на този етап няма адекватен превод на български), математическо моделиране, статическа обработка на данни, манипулации на данни и др.

Професионалните перспективи
Концепцията за Data Science се появява за първи път през 60-70-те години в научните трудове на Тюки и Наир, които говорят за интеграцията на статистика и компютърни науки, които са все по-популярни тогава. Терминът навлиза трайно отначало само в учебниците, а после и в бизнес практиката в края на миналия век. Тогава събирането и организацията на данните от различните институции и най-вече от бизнеса започва да се превръща в основен източник за по-нататъшно анализиране и прогнозиране на процесите не само там, но и в икономиката по принцип. Реално бумът на Data Science върви ръка за ръка с масовото развитие на компютърните системи, тъй като това различава тази "наука" от стандартните статистически обработки. Реално Data Science взема най-доброто от няколко различни, но и взаимно свързани категории: обработка и организация на данни, статистика, математика, компютърни науки и бизнес анализ. Тя интегрира в себе си и други концепции като изкуствен интелект, интернет на нещата, машинно самообучение и др.

Потенциалът на Data Science се измерва с нейната осъзната полезност. Все повече фирми осъзнават абсолютната необходимост да базират своите стратегически решения не на предположения и догадки, а на анализ на своето представяне, на участието на конкуренцията, на бизнес климата, на факторите и тенденциите, които формират средата, в която оперират и тн. Всичко това се извършва на основата на анализ на данните и колкото по-задълбочен и комплексен е той, толкова по-голямо е предимството на дадена фирма пред нейните конкуренти в бранша. Data Science представя именно тази стъпка като затваря пълния цикъл от дефинирането на бизнес проблемите до готовите резултати, на базата на които да бъдат взети решенията.

Неслучайно тази професия се намира в топ 5 на най-популярните в Северна Америка и в света по принцип, при това за последните 5 години.

Моето образование
Имам докторска степен по статистика. Учил съм в България и Великобритания. Имам специализации в Германия, Англия и Ирландия. Въпреки че в началото случайно попаднах в тази сфера, продължих да уча статистика до края на образованието си. Приех тази наука и като цялостна професионална реализация.

Моят път дотук
Професионалният ми опит започна от една малка агенция за маркетингови и извадкови изследвания "Витоша рисърч" още като студент. В нея прилагах всичко научено от университета и реално сблъсъкът между теория и практика ме научи на много неща. Видях кои методи са приложими, кои не. Разбрах много за практическата страна на статистическите анализи, както и за първи път се сблъсках с бизнес приложението на статистическото моделиране. Реално 7-те години, прекарани там, ми дадоха много ценен опит, който за съжаление не може да се получи в университета.

След "Витоша рисърч" прекарах няколко години в Англия, където усъвършенствах знания и практически умения, сблъсквайки се с опита на колегите от западните университети и практики. Прекарах време в Оксфорд и Есекс, работих по международни изследователски проекти като ESS, ISSP, както и множество адхок проекти, свързани с обработка на данни от извадкови изследвания. Тогава за първи път се сблъсках с по-техническата страна на тази професия. Запознах се с open source платформите, за първи път видях и работих с езика R, който днес е абсолютният стандарт в data science.

След връщането ми в България, което беше изцяло мой целенасочен избор, работих за кратко от страна на клиента – в БТК. Бях анализатор и CRM специалист. Въпреки сравнително краткия ми престой там, опитът, който получих в областта на големите данни (big data), беше безценен. Сравнително слабото техническо обезпечение на фирмата тогава не попречи да се работи с огромно количество данни. Начините на обработката се дефинираше изцяло от бизнес проблемите, целите и приоритетите. Тук реално видях потенциала на data science и статистиката при вземането на решения за нови продукти, определяне на ценови равнища, таргетиране на клиенти, индивидуални оферти, оценка на рекламни кампании и тн.

След близо 2 години в тази област се преместих в друга консултантска фирма, която обслужваше големи бизнес клиенти именно в тези области. Тук реално започнах да прилагам наученото в БТК и в други области на бизнеса. Не след дълго с още трима мои колеги решихме да основем Gemseek, като се позиционирахме като малка бутикова консултантска организация, обслужваща клиенти в областта на маркетинговите изследвания, бизнес анализа, ауторсинга, прогнозиране на продажбите, клиентската удовлетвореност, брандинга и други области на аналитичния маркетинг. В рамките на няколко години се разраснахме и в края на миналата година достигнахме 180 души. В момента ръководя екип от анализатори (data scientists) с различни профили и знания и смея да твърдя, че сме едни от лидерите в предоставянето на подобни услуги в България и Европа.

Моите задачи и отговорности
Към момента моята роля е мениджърска, въпреки че с удоволствие се включвам и в по-оперативни задачи. Наблюдавам и контролирам екипа, разпределям задачи според личните знания и опит на моите колеги. Следя за правилната кореспонденция и комуникация с клиента, което за нас е от изключително важно значение. Участвам в множество срещи както вътрешни за фирмата, така и между представителите на бизнеса и клиентите. Изнасям презентации с резултатите от нашите анализи, както и на редица бизнес събития с международно участие. Съществена част от работата ми е свързана с изработката на иновативни методи, базирани на теоретични модели и моя практически опит до момента, което да даде на нашите оферти онова преимущество, което ни отличава от останалите в този иначе доста конкурентен бранш

Нужните умения и опит
На първо място е образованието и детайлното познаване както на съвременните методи за обработка на данни, така и по-класическите анализи, които в никакъв случай не бива да бъдат забравяни. Класическото образование в областта на статистиката и математиката е абсолютно задължителната основа за data science. Непознаването им прави разбирането и прилагането на по-новите и съвременни методи доста трудно, а резултатите от анализите - съмнителни. Често пъти съветвам млади хора, които искат да се занимават с data science, задължително да прекарат 3-4 години в изучаване на статистика, приложна математика, теория на вероятностите, Байесова статистика и др. и след това да се насочат към самата същност на data science.

Следващата стъпка е задълбаване в дебрите на IT и компютърните науки. Познаването и практическото използване на един (а напоследък поне два езика за програмиране) е нещо, без което никой съвременен data science специалист не може да се развива. Отдавна отмина времето на онези софтуерни програми, струващи стотици хиляди евро, при които анализът се осъществяваше в менютата и се ограничаваше само с включените там анализи. Днес нещата са изключително динамични и базирани на споделянето. Различни специалисти, учени, ентусиасти разработват пакети и библиотеки с останалите си колеги по света напълно безплатно. Използването и прилагането им обаче е въпрос на знания и умения, а интерпретацията на резултатите - на предишен опит. Допълнително към това, познанията в областта на облачните услуги, администрирането на бази данни, уеб интеграция и, не на последно място, инструментите за визуализация са ключови.

На последно място, но не по значение, е мотивацията и желанието за усъвършенстване и специализация в определена област на data science. Формалното образование в университетите (независимо колко престижен и реномиран е даден университет) дава само основата и се стреми да "запълни" празните места на едно средно ниво. Въпрос на избор на всеки е да надгради над това ниво и да развие себе си в дадена област на тази наука.

Моите предизвикателства
Реално този тип услуга е изцяло зависим от хората и техните умения. За нея не са необходимо производствени мощности и инсталации, дори формални помещения или офис. Не е изненадващ фактът, че основните предизвикателства са свързани с намирането на подходящи хора. Качеството на образованието, практическият опит, способността да се справяш с различни предизвикателства, както от бизнес естество, така и от техническо, работата с бази от данни, познаването на самите данни и приложението на конкретен метод са само част от проблемите, които се решават ежедневно. Това няма да е възможно без качествени и мотивирани хора.

Другата голяма група проблеми е свързана с комуникацията с клиентите. Правилното разбиране на техните нужди, формулирането на целите им, интеграцията и консолидацията на наличните данни, възможността и познаването на методите и практическото извличане на трендовете и закономерностите представляват немалък дял от ежедневната работа. От друга страна, правилната интерпретация на резултатите от анализа и гладкото им интегриране в самите процеси в компаниите са важен измерител за нашата ефективност. От бизнес гледна точка, именно това са онези черти, които те правят по-привлекателен в очите на потенциалните ти клиенти и те правят конкурентоспособен

Моето удовлетворение
Удовлетворението от работата до голяма степен е свързано с предишния въпрос за предизвикателствата. Всеки е изживявал в училище онова вътрешно усещане, когато е успял да реши трудна задача съвсем сам. Същото е и сега, но в по-различен мащаб. Прилагайки практически някой модел, започвайки от извличането на данните, минавайки през тяхната първоначална обработка, мислейки върху методите и в крайна сметка интерпретирайки резултатите в контекста на конкретния проблем, са сравними с онова чувство в училище. Всеки път, когато видиш своите клиенти да кимат одобрително с глава, когато твоите презентация водят до дискусия, когато съумееш да намериш отговор на труден въпрос от тяхна страна, те кара да се чувстваш добре и на правилното място.

Изключително удоволствие ми доставят и дискусиите с колегите от екипа ми. Всички се събираме в неформална обстановка, говорим си за различните методи и модели. Понякога някой от нас споделя своя опит с библиотека или нов метод, кода за това, вида на данните и какво е направил с тях. Шегуваме се, смеем се и аз лично научавам доста неща покрай подобен тип разговори и дискусии.

Заплатата
Както казах по-рано, намирането на подходящи хора е едно от немалките предизвикателства в тази област. Това е и определящо за значително по-високите нива на заплащане, както за стартова позиция, така и в сравнение със средните нива на заплащане по принцип. Намирането на подходящи хора обаче е само първата част в отношенията с тях. За нас като работодател е пределно ясно, че задържането им в силно конкурентна среда също ще е трудна задача. Ето защо се стремим да поддържаме заплащането на адекватни нива в съответствие с опита и уменията на нашите служители.

Моите източници на информация
В нашата област основните източници на информация са блоговете и форумите в интернет. Както споменах по-рано, data science е индустрия, основана на споделянето. Споделят се предишен опит, кодове, библиотеки, пакети и какво ли още не. Форумите и сайтовете от рода на LinkedIn са важен и много полезен източник и на дискусии, начин за лична комуникация с водещите специалисти по цял свят, както и споделяне на своето виждане и опит. Реално динамиката в сектора е толкова голяма, че всеки друг източник (особено печатните) би изпитвал затруднения при актуалното отразяване на всички нововъведения и иновации.

Моите планове за развитие
Към момента работим по различни проекти, свързани с най-общо казано с иновации. Правим опита да подобрим някои методи за обработка на неформатиран текст Natural Language Processing (NLP), deep learning методи в различни ситуации, за да оптимизираме моделите и прогнозите на тяхна основа. Инвестираме време в разработването на автоматични инструменти на основата на изкуствен интелект, които да отменят човешката намеса на повечето от етапите на моделиране, особено в случаите, когато една и съща операция се извършва постоянно. Също така разработваме различни онлайн приложения за визуализация на резултатите от анализите в интерактивен формат.

Моят съвет към бъдещите специалисти
Както споменах по-рано единствената цена, която всички прохождащи специалисти или хора с интерес в data science трябва да платят, е инвестицията във време и усилия. Всичко останало е безплатно и може да бъде намерено сравнително лесно. Това, което е необходимо обаче, е немалка доза усилия както във формалното образование, така и след това. Най-ценния актив на експерт в тази област са неговите знания и умения, а те за съжаление не идват даром.

Друг важен фактор е практиката. Никога не разчитайте на готовите примери или решението на задачите, които виждате в книгите или форумите. Те са направени така, че моделите винаги да са оптимални, с най-добре параметри и резултати. Интернет изобилства с "истински данни", такива, които не са манипулирани преди това, такива, които са събрани в реални, а не в лабораторни (контролирани) условия. Съветът ми към всички, които искат да практикуват тази професия, е да се упражняват и да прилагат своите нови знания върху такъв тип данни. Тук реално могат да се видят проблемите при обработката им, прилагането на определен метод, невъзможността от прилагането на други, броят и видът на параметрите, които трябва да се настроят и тн.


Share Tweet Share
още от тази рубрика:

Реклама

Реклама

© 2003-2019 Икономедиа АД съгласно Общи условия за ползване. Политика за бисквитките. Декларация за поверителност.
Общи условия за публикуване на обява ново.
Поставянето на връзки към материали в сайтовете на Икономедиа е свободно. Уеб разработка и дизайн на Икономедиа. Сайтът използва графични елементи от famfamfam + DryIcons. Някои снимки © 2019 Associated Press и Reuters. Всички права запазени.
Действителни собственици на настоящото издание са Иво Георгиев Прокопиев и Теодор Иванов Захов.
mobile Към мобилната версия на сайта

Бизнес: КапиталКариериБизнесРегалОдитFoton.bg

Новини: ДневникЕвропа

IT: IDG.BGComputerworldPC WorldCIONetworkworld

Развлечение: БакхусLIGHT

На английски: KQuarterly