داده کاوی، متن کاوی، و وب کاوی: تعاریف و کاربردها نوشته علی اکبر خاصه

کتابخانه‌ ها نمی‌توانند نیاز کاربران را به سرعت تأمین نماینـد. بنـابراین، ضـرورت دارد کـه روش سـریع و اثربخشـی بـرای کمـک بـه کاربران خود بیابند. داده کاوی یک فناوری اطلاعاتی مهم و جدید است کـه بـرای شناسـایی داده‌ های مهـم از میـان مقـادیر زیـادی از پیشینه‌های وسیع به کار می‌رود. به کلام دیگر، آن عبارت است از فرایند نمایاندن انگاره‌های پنهـان مهـم در یـک مجموعـه داده‌ای. سودمندی داده کاوی آن است که به طور موثری گرایشات موجود در یک صنعت یا حرفه را جستجو می‌کند و بازده‌های مفیـدی بـرای سازمان‌های حاوی مقادیر عظیم اطلاعات فراهم می‌کند .(Chan and Chen 2006)

بنابراین، برای استخراج اطلاعـات خـاص از اینترنـت، کتابخانه‌ها، و سـایر مجموعه‌های داده‌ای از مفـاهیمی نظیـر داده کـاوی و ابزارهای مختلف مربوط به آن استفاده می‌شود. داده کاوی را تحلیل داده‌ها و استفاده از فنـون نـرم افـزاری بـرای یـافتن انگاره‌ها١ و مقررات موجود در مجموعه‌های داده‌ای تعریف کرده‌اند .(Markov and Russell 2009) داده کاوی نام خـود را از شباهت‌های موجـود در دو حوزه جستجوی اطلاعات ارزشمند در پایگاه‌های بزرگ و حفاری معادن برای استخراج رگه‌هایی از سنگ‌های معدنی ارزشـمند به عاریت گرفته است؛ و ایـن دقیقاً همـان چیـزی اسـت کـه داده کـاوی بـدان اشـاره دارد: اسـتخراج اطلاعـات ارزشـمند از یـک پایگـاه اطلاعاتی بزرگ. داده کاوی نه تنها در صدد یافتن اطلاعات یا پاسخگویی به سوالاتی است کـه در ذهـن کـاربر وجـود دارد، بلکـه دانـش عمیقی که در دل داده‌ها نهفته است را نیز کشـف می‌کند. منظـور مـا از اسـتخراج داده‌ها شـامل هـر دو نـوع داده سـاختاریافته و غیرساختاریافته است

......

  ادامه مطلب ...

ﻣﻘﺪمه ای ﺑﺮ دادهﻛﺎوی نوشته کتابخانه آنلاین

در دو دهه ﻗﺒﻞ ﺗﻮاﻧﺎﯾﻲ ھﺎی ﻓﻨﻲ در ﺑﺮای ﺗﻮﻟﯿﺪ و ﺟﻤﻊ آوری داده ھﺎ به ﺳﺮﻋﺖ اﻓﺰاﯾﺶ ﯾﺎﻓﺘه اﺳﺖ. ﻋﻮاﻣﻠﻲ ﻧﻈﯿﺮ اﺳﺘﻔﺎده ﮔﺴﺘﺮده از ﺑﺎرﻛﺪ ﺑﺮای ﺗﻮﻟﯿﺪات ﺗﺠﺎری، ﺑه ﺧﺪﻣﺖ ﮔﺮﻓﺘﻦ ﻛﺎﻣﭙﯿﻮﺗﺮ در ﻛﺴﺐ و ﻛﺎر، ﻋﻠﻮم، ﺧﺪﻣﺎت دوﻟﺘﻲ و ﭘﯿﺸﺮﻓﺖ در وﺳﺎﺋﻞ ﺟﻤﻊ آوری داده، از اﺳﻜﻦ ﻛﺮدن ﻣﺘﻮن و ﺗﺼﺎوﯾﺮ ﺗﺎ ﺳﯿﺴﺘم های ﺳﻨﺠﺶ از دور ﻣﺎھﻮاره ای، در اﯾﻦ ﺗﻐﯿﯿﺮات ﻧﻘﺶ ﻣﮭﻤﻲ دارﻧﺪ .ﺑﻄﻮر ﻛﻠﻲ اﺳﺘﻔﺎده ھﻤﮕﺎﻧﻲ از وب و اﯾﻨﺘﺮﻧﺖ ﺑه ﻋﻨﻮان ﯾﻚ ﺳﯿﺴﺘﻢ اﻃﻼع رﺳﺎﻧﻲ ﺟﮭﺎﻧﻲ ﻣﺎ را ﻣﻮاﺟه ﺑﺎ ﺣﺠﻢ زﯾﺎدی از داده و اﻃﻼﻋﺎت ﻣﻲﻛﻨﺪ. اﯾﻦ رﺷﺪ اﻧﻔﺠﺎری در دادهھﺎی ذﺧﯿﺮه ﺷﺪه، ﻧﯿﺎز ﻣﺒﺮم وﺟﻮد ﺗﻜﻨﻮﻟﻮژی ھﺎی ﺟﺪﯾﺪ و اﺑﺰارھﺎی ﺧﻮدﻛﺎری را اﯾﺠﺎد ﻛﺮده ﻛه ﺑه ﺻﻮرت ھﻮﺷﻤﻨﺪ ﺑه اﻧﺴﺎن ﯾﺎری رﺳﺎﻧﻨﺪ ﺗﺎ اﯾﻦ ﺣﺠﻢ زﯾﺎد داده را ﺑه اﻃﻼﻋﺎت و داﻧﺶ ﺗﺒﺪﯾﻞ ﻛﻨﺪ: داده ﻛﺎوی ﺑه ﻋﻨﻮان ﯾﻚ راه ﺣﻞ ﺑﺮای اﯾﻦ ﻣﺴﺎﺋﻞ ﻣﻄﺮح ﻣﻲ ﺑﺎﺷﺪ. در ﯾﻚ ﺗﻌﺮﯾﻒ ﻏﯿﺮ رﺳﻤﻲ داده ﻛﺎوی ﻓﺮآﯾﻨﺪی اﺳﺖ، ﺧﻮدﻛﺎر ﺑﺮای اﺳﺘﺨﺮاج اﻟﮕﻮھﺎﯾﻲ ﻛه داﻧﺶ را ﺑﺎزﻧﻤﺎﯾﻲ ﻣﻲ ﻛﻨﻨﺪ، ﻛه اﯾﻦ داﻧﺶ ﺑه ﺻﻮرت ﺿﻤﻨﻲ در ﭘﺎﯾﮕﺎه داده ھﺎی ﻋﻈﯿﻢ، اﻧﺒﺎره داده ودﯾﮕﺮ ﻣﺨﺎزن ﺑﺰرگ اﻃﻼﻋﺎت، ذﺧﯿﺮه ﺷﺪه اﺳﺖ.

......

  ادامه مطلب ...