تحلیل داده
تحلیل داده
تحلیل داده یک علم تحولآفرینه که به ما امکان استخراج بینشهای ارزشمندی از اطلاعات و دادههای خام میده و به بهرهمندی از نتایج معنادار و اطلاعات مفید منجر میشه
امروزه تکنیکها و فرآیندهای تحلیل داده به الگوریتمهایی تبدیل شدهان که به واسطه نرمافزارها امکان تحلیل آماری و کسب بینشهای گرانبها توسط هر انسانی رو به ارمغان میارن
تحلیل داده نقش بسزایی در بهبود عملکرد کسبوکار ایفا میکنه چرا که به سازمانها این امکان رو میده عملیات رو بهینهسازی کرده و با ادغام فرآیند تحلیل در مدلهای کسبوکار، روشهای کارآمدتری رو شناسایی کنن، هزینهها رو کاهش بدن و از ذخیرهسازی و تحلیل حجم زیادی از دادهها برای تصمیمگیریهای آگاهانه بهره ببرن
اصول تجزیه و تحلیل داده
اصول تجزیه و تحلیل دادهها بر اساس استاندارد (فرآیند داده کاوی برای صنایع) پیاده سازی میشه
- فهم مدل کسب و کار
- فهم دادهها
- آماده سازی
- مدل سازی دادهها
- ارزیابی کردن
- استقرار و پیاده سازی

فهم مدل کسب و کار
نئو ویژن برای به ارمغان آوردن چشمانداز شما گامی اساسی برای درک و شناسایی پیش نیازهای کسب و کارتون برمیداره و اطمینان حاصل میکنه که به درک درستی از فرآیندی های جاری برسه
درک عمیق نئوویژن از فرآیندها امکان طراحی و تبیین روشهای موثر و کارآمد برای پیشبرد تحلیل رو به همراه داره که به موجب این مهم، چشماندازی دقیق از اهداف نهایی پدید خواهد اومد
فهم داده ها
با شناسایی اطلاعات و تبیین روشها، مرحله بعدی کند و کاو در دادهها، متناسب با صورت مسئله آغاز میشه و دادههای موجود صحتسنجی میشن
اساس و بنیان صحت سنجی دادهها:
- دسته بندی اطلاعات بر اساس کمی یا کیفی بودن
- شناسایی روابط بین متغیرها
- بررسی کارآمدی دادهها
و در نهایت بعد از سنجش دادهها، کیفیت دیتاستهای جمع آوری شده تایید میشه
آماده سازی داده
میشه گفت که این مرحله از پروژه یکی از مهم ترین و زمانبرترین قسمتهای هر پروژه تحلیل دادهست. توی این مرحله تمرکز اصلی روی این موضوعه که اطلاعاتی که برای تحلیل و مدل سازی غیرکارآمد هستن رو به اطلاعات بهینه و کارآمد تبدیل کنیم
خروجی نهایی این مرحله برای ما دیتاستهای مورد نیاز برای مدل سازی رو تامین میکنه. این فرآیند شامل 4 مرحله مهم و اساسیه:
- انتخاب کردن اطلاعات: تمامی دیتاستهایی که قراره در مراحل بعدی ازشون استفاده کنیم رو شناسایی و انتخاب میکنیم.
- پاکسازی دادهها: برای اینکه تحلیل ما دچار سوگیری نشه به شناسایی دادههای نامشخص، دادههای پرت و دادههای تکراری میپردازیم و اگر مقادیر درست و مشخص براشون پیدا نکردیم، اون دادهها رو از چرخه تحلیل خارج میکنیم
- ایجاد اطلاعات: در مواردی ممکنه یک سری از ویژگی ها به صورت مشخص به ما داده نشده باشه ولی میتونیم با استفاده از دادههای دیگه، اون اطلاعات رو به دست بیاریم؛ برای مثال اگر ما قیمت و مقدار فروش کالاها رو داشته باشیم، میتونیم درآمد کل رو محاسبه کنیم
- درآمیختن اطلاعات: در چارچوب یک کسب و کار، ممکنه منابع اطلاعاتی مختلفی وجود داشته باشه که برای رسیدن به یک نگاه جامع و یکپارچه باید اون اطلاعات رو با هم ترکیب کنیم؛ برای مثال، اطلاعات سیستم فروش و سیستم مالی ممکنه در دیتابیسهای مختلف ثبت شده باشه و ما برای اینکه دید جامعی به دست بیاریم، این اطلاعات رو با هم ترکیب میکنیم
مدل سازی داده
برای اینکه به صورت کارآمد بتونیم پروژه رو به اهداف کسب و کار شما نزدیک کنیم، تکنیکهای متفاوتی رو به کار میبریم؛ روشهای متفاوتی برای حل یک مسئله وجود داره و هر روش با رویکردی متمایز اطلاعات رو مختص با چارچوبی که داره به کار میگیره
ما با استفاده از تکنیکهای مختلف اطلاعات رو مدل سازی میکنیم و نتایجشون رو با هم مقایسه میکنیم تا به یک مدل بهینه برسیم. این مرحله ارتباط تنگاتنگی با مرحله قبلی داره و ممکنه بعد از بررسی چند مدل، مشخص بشه اطلاعاتی که آماده کرده بودیم با اشکالاتی مواجه بوده و نیاز داریم که اطلاعات رو مجددا آماده سازی کنیم
ارزیابی کردن
در این نقطه، مدلهای منتخب رو در عمل آزمایش میکنیم تا ببینیم آیا این مدلها میتونن ما رو به اهداف اصلی پروژه برسونن یا نه؛ نتایج تستهایی که در عمل انجام دادیم میتونه به بهبود عملکرد مدل در واقعیت کمک زیادی کنه تا نکاتی که در مدل سازی اولیه بهشون توجهی نشده بود، شناسایی بشن و به نهایی شدن مدل کمک کنن. در نهایت اگر این مدل بتونه توی تصمیم سازی برای کسب و کار کارآمد باشه، از خروجی این مرحله در واقعیت استفاده میکنیم
استقرار و پیاده سازی
ساخت مدل به معنی اتمام پروژه نیست؛ معمولا لازمه دانشی که از مدل به دست میاد به نحوی دسته بندی و ارائه بشه که مشتری بتونه از این اطلاعات بهره ببره. بر اساس نیاز، فاز استقرار میتونه به سادگی ارائه کردن یک گزارش یا به پیچیدگی پیاده سازی یک فرآیند داده کاوی تکرارپذیر باشه.
در بیشتر موارد، این کاربره که مراحل استقرار رو پیش میبره نه تحلیلگر. در تمامی موارد فهمیدن اینکه چه فعالیتهایی باید انجام بشه تا بتونیم از مدل سازی انجام شده به نحو احسن استفاده کنیم، از اهمیت بالایی برخورداره.
یک مدل تا زمانی که مشتری به نتایجش دسترسی نداشته باشه، کارآمد نیست.
پیچیدگی این مرحله میتونه تو حیطههای محتلفی خودش رو نشون بده. مرحله نهایی شامل چهار بخش میشه:
- برنامه ریزی برای استقرار: توسعه و مستندسازی یک برنامه برای پیاده سازی مدل
- برنامه ریزی برای نظارت و نگهداری: ایجاد یک برنامه نظارت و نگهداری برای جلوگیری از مشکلات در مرحله عملیاتی (یا مرحله پس از انجام پروژه) یک مدل
- تهیه گزارش نهایی: تیم انجام دهنده پروژه، خلاصهای از پروژه را مستند میکنه که ممکنه شامل ارائه نتایج نهایی داده کاوی باشه
- بازبینی پروژه: ایجاد یک پروژه گذشته نگر در مورد اینکه چه چیزی به درستی پیش رفت، چه چیزی میشد بهتر باشه و چطور در آینده بهتر بشه
ممکنه کار سازمان شما در این نقطه تموم نشه
چارچوب ذکر شده، چیزی رو که باید بعد از اتمام پروژه انجام بدید رو مشخص نمیکنه ولی اگر قرار باشه مدلی ساخته بشه ما باید اطمینان پیدا کنیم که ساخت مدل به صورت پایدار انجام بشه. اغلب نظارت مداوم و تنظیم گاه به گاه مدل باید صورت بگیره.