Post-WIMP интерфейстер

WIMP немесе GUI интерфейсі

Графикалық пайдаланушы интерфейсі (GUI) пайдалану пайдаланушы интерфейсінің бүгінде ең көп таралған түрі болып табылады. Ол суреттер, графика және белгішелерді пайдаланады, өйткені ол адамның компьютермен өзара іс-қимылы үшін достық жолы болып табылады - демек ол «графикалық» деп аталады.

Ол пайдаланады, өйткені GUI сондай-ақ WIMP интерфейсі ретінде белгілі:

Windows - жиі пайдаланылатын қолданбалар іске асырылатын экранның тік бұрышты ауданы

Белгішелер - бағдарламадан немесе аппараттық құрылғыны ұсыну үшін пайдаланылады сурет немесе символ

Мәзірлер - Пайдаланушы талап болатынын таңдай аласыз, оның опциялар тізімі

Көрсеткіштер - символ сияқты тінтуірді жылжытпау ретінде экранның айналасында жүріп көрсетеді. Сізге объектілерді таңдау үшін көмектеседі.

Артықшылықтары мен кемшіліктері

Артықшылықтары мен кемшіліктері

Артықшылықтары Кемшіліктері
пайдаланушы интерфейсінің бұл түрі бастаушы үшін әсіресе, пайдалану оңай GUI басқа интерфейстердің қарағанда қатты дискідегі бос орын әлдеқайда көп мөлшерде созылуы
WIMP / GUI интерфейсін пайдаланып, жүйесі айналасында өз жолын зерттеуге және табуы оңай.   басқа интерфейс түрлеріне қарағанда олар іске қосу үшін айтарлықтай көп жадты (RAM) қажет етеді
күрделі командадерді білуінің қажеті жоқ.   Сіз интерфейстің басқа түрлеріне қарағанда, олар көп өңдеу қуатын пайдалануға 
WIMP интерфейстері бар енгізілген ақылға қонымды «Анықтама» жүйесі бар.   Тәжірибелі бағдарламашылар пайдалану үшін олар баяу болуы мүмкін. Бұл адамдар жиі CLI пайдалануға әлдеқайда тез интерфейстердің артықшылықтарын таба алады.
WYSIWYG режимінде артықшылықты аласыз  
Олар әр түрлі программалар қосымшаларында деректермен ауыса алады  

Кесте 5- Артықшылықтары мен кемшіліктері

 

А GUI көрнекі (графикалық) заттар айналасында салынған интерфейс болып табылады:

• Windows ақпаратты көрсету үшін пайдаланылатын экранның аймақтары болып табылады

• Белгішелер т.б. қалталарды көрсету үшін пайдаланылатын шағын суреттер, бағдарламалық қамтамасыз ету болып табылады

• Мәзірлер- пайдаланушы таңдай алатын опциялардың тізімі бар

Сілтегіш-экран бойынша жылжытуға болатын көрсеткі болып табылады және заттарды таңдау үшін пайдаланылады

Windows XP бар GUI бар операциялық жүйенің үлгісі болып табылады.

GUI салдарынан интерфейстің көрнекі сипатына пайдалану өте оңай - Пайдаланушының заттарды не істеу сияқты сұрақтарына кілттер көп.

Өте қуатты компьютерлер қажет, сондықтан, GUI талап ететін жақсы графика барлық көрсеткіш үшін есептеу қуатын көп алады.

 

Графикалық пайдаланушы интерфейс (GUI): бағдарламаның енгізуін және шығаруын білдіруге суреттер пайдалану ғана емес, сөздерді де пайдалану. Кіріс мұндай пернетақта мен тышқан ретінде құрылғылар арқылы қабылданады.

Көп жыл бұрын компьютерлер өте қуатты болған жоқ кезде олар GUI үшін қажетті түсті, графиканы бейнелеу мүмкін емес еді. Кептеген компьютерді пайдалану қол жетімді.

Пайдаланушы қара экранда ештеңе көрмейді. Олар орын жасау үшін команданы теру керек еді.

 Мәтін файлды көшіру үшін пайдаланушы түрді қатты дискіге иілгіш дискіден ауыстырғанын ЕСКЕРТПЕЛЕР деп атады:

> COPY A:\NOTES.TXT C:\

пайдаланушы олар компьютерлік жүйенің пайдалана алатындай біртүрлі командалардың тұтас жиынтығын үйрену керек еді. Келесі не істеу керегін сізге айтып, ешқандай көрнекі кілттер, қосымша ол өте қызықты емес еді.

 

3.Пайдаланушының жеке және ментальды сипаттамалары. Пайдаланушы интерфейсін өңдеу кезеңдері. Интерфейстерді тестілеу түрлері (пайдаланушыларды тестілеу). Интерфейстер даму перспективалары.

Интерфейстердің даму болашағы. Бұл пайдалануға өте қиын болғандықтан пайдаланылатын компьютерлерді білдіреді, сондықтан интерфейстің бұл түрі сараптамалық пайдаланушылар үшін ғана жарамды.

Адам компьютерге (және т.б. сол командалар, нәтижелерін көру үшін, бұйырады, оны беруге) өзара әрекеттесу үшін жүйе пайдаланушы интерфейс белгілейді.

 

Графикалық пайдаланушы интерфейсі

Информатика, графикалық пайдаланушы интерфейсі (GUI / ɡuːiː /), пайдаланушылар орнына мәтін негізіндегі пайдаланушы интерфейсі, мұндай қайталама белгілеуге арналған графикалық белгішелер және көрнекі көрсеткіштер арқылы электрондық құрылғылармен өзара іс-қимыл жасауға мүмкіндік беретін пайдаланушы интерфейсінің бір түрі, команда терілген жапсырмаларын немесе мәтінді шарлау. Бар GUI компьютерлік пернетақтада терілуін талап ететін команда жолы интерфейстер (CLIs), қабылдайтын тік оқыту қисық үшін реакция енгізілді.

Бір GUI әрекеттер әдетте графикалық элементтердің Тікелей қимылдары арқылы жүзеге асырылады. Компьютерлер Beyond, GUI мұндай MP3 ойнатқыштары, портативті медиа ойыншылардың ойын құрылғылары, смартфондар мен ас үй шаруашылығында, қызметтік және өндірістік жабдықтар ретінде көптеген Тасымалды мобильдік құрылғылар пайдаланылады. Мерзімді GUI (жетекшісі-дейін дисплей (HUD) осындай видео ойындар интерфейстердің, басқа да төменгі дисплей ажыратымдылығы түрлеріне қолданылуға тиіс еместікке ұмтылады немесе көлемді дисплейлер сияқты жалпақ экрандар, шектелмейді, өйткені мерзімді Xerox Palo Alto зерттеу орталығының (ПАРКІ) информатика зерттеуінің дәстүрі, жалпы ақпаратты сипаттай алатын екі өлшемді дисплей экрандары аясынан шектеледі.

Post-WIMP интерфейстер

Мұндай жеке сандық көмекшілер (PDA) және смартфондар сияқты шағын мобильді құрылғылар әдетте байланысты кеңістікте және қол жетімді енгізу құрылғылар шектеулерге, түрлі біріктіретін метафора бар WIMP элементтерін пайдаланыңыз. WIMP-ақ ​​қолайлы емес, ол үшін өзара іс-қимыл Бағдарламалар жаңа әдістерін пайдалана алады, ұжымдық кейінгі WIMP пайдаланушы интерфейстері аталады. 2011 жылдың, мұндай Apple компаниясының түйініне (Айфон) және Android сияқты кейбір сенсорлы-негізделген амалдық жүйелер кейінгі WIMP атындағы графикалық интерфейс класында пайдаланылды. Бір Меңзер мен тінтуір арқылы қолдау көрсетілмейді осындай қысу және айналмалы ретінде іс-әрекеттерін, мүмкіндік беретін дисплей, байланыста ден астам саусағыңызды пайдаланып өзара іс-қимыл бұл қолдау стильдері.

Бір GUI тиімді өзара іс-қимыл үшін Адам интерфейс құрылғылар, әсіресе пернелер тіркесімдері, меңзер үшін меңзегіш құрылғылар (немесе, керісінше көрсеткіш) бақылау бірге пайдаланылатын, компьютерлік пернетақта қамтиды: тышқан, меңзегіш таяқша сенсорлы тақта, трекбол джойстик, виртуалды пернетақта және штаб-дисплейлер (көз деңгейінде мөлдір ақпараттық құрылғылар).

GUI әсер ететін бағдарламалар арқылы орындалған әрекеттер, сондай-ақ бар. Мысалы, компьютерлік бағдарламалар арасында ақпарат алмасуға ықпал ету inotify немесе D-Bus сияқты компоненттер бар.

Амалдық жүйе команда жолының интерфейстер

Операциялық жүйе (ОЖ) команда жолы интерфейстер де әдетте операциялық жүйемен жабдықталған бөлек бағдарламалар.

Мұндай мәтін іске интерфейс бағдарлама жиі командалық процессор немесе қабық, команда жолы аудармашы деп аталады.

 

Қолдану команда жолының интерфейстері

Қолданбалы бағдарламалар (операциялық жүйелерге қарағанда), сондай-ақ команда жолы интерфейстері болуы мүмкін.

Қолданбалы бағдарлама бірде, кез келген, немесе команда жолы интерфейсі тетіктерін осы үш негізгі түрлерінің барлық қолдауы:

1. Параметрлер: Көптеген операциялық жүйелер, ол іске қосылған кезде бағдарламаға қосымша ақпаратты тапсыру құралын қолдайды. бағдарлама ОЖ команда жолы қабығы іске қосылғанда, бағдарлама атауы қосымша мәтінмен іске қосылып бағдарламасын береді.

2. Интерактивті команда жолы сессиялары: іске қосқаннан кейін, бағдарламада мәтін түрінде командадерді енгізу үшін тәуелсіз құралдарымен оператор болады.

3. OS процессінің аралық байланысы: Көптеген операциялық жүйелер (мысалы; стандартты ағындары немесе атындағы құбырлар) процесс аралық байланыс құралдарын қолдайды. Клиенттік процестерінен командалық жолдар келесі әдістердің бірі арқылы CLI бағдарламаға қайта бағытталуы мүмкін.

Мәзір интерфейсі

Интерфейстің бұл түрі сіз экранда немесе мәзірлер сериясы арқылы өз жол жұмысын  компьютерге немесе құрылғымен өзара іс-қимыл жасауға мүмкіндік береді.

Екеуі де мәзір жетегі интерфейсін қолданып, сіздің Ipod немесе ұялы телефоныз туралы ойланып көрініз. Сізге мәзір беріледі, сіз таңдау жасап, содан кейін келесі экранда мәзір пайда болады. Сізде басқа таңдау жасауға болады.

Банкомат машиналары (банкоматтар) мәзір жетегі интерфейстің тағы бір жақсы мысалы болып табылады.

Мәзір жетегі интерфейстер, сондай-ақ ауызша емес, көрнекі болуы мүмкін. Сіз бір кездері телефон қоңырауын жасап және «ABC үшін баспасөзде 1 DEF арналған баспасөз 2 GHI үшін баспасөз сұрады ма?

Мәзір интерфейсін пайдалану бағдарламалық жасақтамасы. Сіз мәзір параметрлері арқылы өз жолы жұмысының бағдарламалық қамтамасыздығын, көптеген мүмкіндіктерін пайдалануға болады. Егер сөзпроцессорі немесе электрондық кесте қаптамада мәзірлер көзқарасы бар және берілген түрлі таңдау бөлімін қараңыз.

Жақсы жобаланған мәзір интерфейсі, сіз жай ғана нұсқауларды орындаңыз және сізге таңдау жасауға, пайдалануға қарапайым болып табылады.

Артықшылықтары мен кемшіліктері

Артықшылықтары Кемшіліктері
пайдалануда өте қарапайым. Нашар әзірленген мәзірде интерфейсін пайдалану баяу болуы мүмкін
Там нет команды, чтобы узнать или вспомнить,   это может быть раздражающим, если есть слишком много экранов меню, чтобы работать через - пользователи раздражаться или скучно, если он занимает слишком много времени
Үйрену арқылы немесе жұмыс істеуге тым көп мәзір экрандары бар болса, ол тітіркендіргіш болуы мүмкін, есте сақтау үшін команда бар - бұған тым ұзақ уақыт кетеді Сіз білесіз, қайда болса да мәзір экрандары арқылы солай жұмыс істеуге тиісіз.Вы должны работать ваш путь через меню, даже если вы знаете, куда вы хотите, чтобы добраться
Сіз не істеуді білмей, тіпті егер, сіз әдетте бағдарламалар арасын алға және артқа сілкіп ұстау үшін экранда мәзір үлкен бөлікті алуы мүмкін опциялардың айналасында өз жолын сұраса болады.
Мәзір интерфейстері көрнекі болуы тиіс емес, Телефондар немесе көру қабілеті нашар адамдар үшін мәзір нашар жасалған болса, ол мысалы жазуды нашар көретін адамдар үшін тым кішкентай, түстер әріптің мәнерін оқуға қиын болуы мүмкін

Кесте 6- Артықшылықтары мен кемшіліктері

 

Дыбыс және сөйлеу интерфейсі

интерфейстің бұл түрі пайдаланушының компьютерде өзара іс-қимылы үшін олардың қалыпты күнделікті тілде сөйлеуі немесе түрі мүмкіндік береді.

Мысалы, мұндай сөзді тану бағдарламалық қамтамасыз ету кейбір қолданбаларда айтқан сөздерді қабылдайды және компьютерде мәтінді түрлендіреді. Бұл бағдарламалар диалог интерфейсіне қарағанда әлдеқайда кең сөздіктер бар.

Жазылған мәтінді пайдалануға мүмкіндік береді және табиғи тілдік интерфейстің үлгісі ретінде табылады. Бұл бағдарламалық қамтамасыз етуге ұқсайтын әңгіме - сұрақтар оны сұрайды және ол сіз үшін қолайлы пікір ретінде қайтып келеді.

Ол әр түрлі екпін, диалектілер, жаргон, омонимдерден тұрады. Бұл дизайнерлер үшін интерфейстің ең күрделі техникалық нысаны болып табылады.

 

Сұрақтар:

1. Юзабилити интерфейсі деген не?

2. Интерфейстің командалық жолы деген не?

3. АМҚ деген не?

4. Меню интерфейстің артықшылықтары мен кемшіліктері бар?

 

Дәріс №5. Деректер қорларының жүйелері.

Мақсаты: осы дәрістің мақсаты SQL негіздері, деректерді параллельді өңдеу және оларды қалпына келтіру, деректер қорын жобалау және құру, ORM бағдарламалау технологиясы дамуын талдау болып табылады.

Жоспар:

1.Деректер қорлары жүйелерінің негіздері: ұғымы, сипаттамасы, архитектурасы. Деректер моделі. Қалыпқа келтіру. Деректер тұтастығына шектеу. Сұраныстарды тиімділеу және оларды өңдеу.

 2.SQL негіздері. Деректерді параллельді өңдеу және оларды қалпына келтіру.

 3.Деректер қорын жобалау және құру. ORM бағдарламалау технологиясы. Үлестірілген, параллельді және гетерогенді деректер базасы.

 

1.Деректер қорлары жүйелерінің негіздері: ұғымы, сипаттамасы, архитектурасы. Деректер моделі. Қалыпқа келтіру. Деректер тұтастығына шектеу. Сұраныстарды тиімділеу және оларды өңдеу.

 

Деректер базасына кіріспе. Дерекқор жазбалары деректердің құрылымдық жиынтығы деп аталады. Компьютер дерекқор деректерін сақтауды ұйымдастыруға бағытталған бағдарламалық қамтамасыз ету. Дерекқорлар сізге оңай қол жеткізуге және шығарып алу үшін логикалық түрде осыған байланысты ақпаратты ұйымдастыруға көмектеседі. Деректер базасын дамыту үшін, мұндай Иерархиялық модель, желілік модель, Реляциялық модель, Нысан-бағдарланған моделін және т.б. ретінде пайдаланылатын бірнеше модельдер бар.

Иерархиялық модель. Иерархиялық моделі деректер төңкерілген ағаш сияқты құрылымнан ұйымдастырылды. Бұл құрылым иерархияда түрлі деректер элементтерін реттейді және бірнеше файлдарды деректер элементтерінің арасында логикалық қарым-қатынас орнату мақсатында көмек көрсетеді. Үлгідегі әрбір бірлік сондай-ақ түйін ретінде белгілі рекорд болып табылады. Әрбір жазбаның  жалғыз ғана авторы бар.

  

1-сурет: Иерархиялық Модель

Желі моделі. Желілік модель басқа жазбаларға сілтемелері бар жазбаларды сақтау үшін қолданылады. Дерекқордағы әрбір жазбада  бірнеше авторлар болуы мүмкін, яғни, деректер элементтерінің арасындағы қатынас көптеген қарым-қатынастар  үшін болуы мүмкін. Сондықтан, бұл модель бірнеше авторлар беретін ағаш сияқты құрылымда көптен-көп қатынастарды береді және иерархиялық құрылымы кеңейтеді. Желілік модел үлкен икемділігі мен деректерге қол жетімділігінің ықпалы иерархиялық моделдің артықшылығын көрсетеді.

 

2-сурет: Network Model

Реляциялық модель. Дерекқорды басқару үшін реляциялық модел қарым-қатынастардың негізінде дерекқор моделі. Реляциялық модельдің негізгі деректер құрылымы нақты тұлға (айталық, студент) туралы ақпарат бағандар мен жолдарда ұсынылған кесте сияқты. Бағандар ұйымның (мысалы студент атауы, мекен-жайы, тіркеу _number) түрлі атрибуттарын (яғни сипаттамалары) санамалау (Сондай-ақ, жазбалар деп аталады) жолдар ұйымын (мысалы, нақты студент) жекелеп ұсынады..

  Нысан-бағдарланған моделі. Бұл модельде біз объект бағдарланған бағдарламаны функционалды талқылау керекпіз. Ол бағдарламалау тілі объектілерін сақтауға артық алынады. Ана тілі үйлесімділігі бар, толық дерекқордың бағдарламалау мүмкіндігін береді. Ол бағдарламалау тілдерін қарсылық дерекқор функционалы қосады. Бұл тәсіл тұрақты деректер моделін және тілді қоршаған ортаға қолдану және деректер базасын дамытуға ұқсас болып табылады. Өтініштер толығырақ табиғи деректерде модельдеуді қолдану, аз кодты талап етеді, ал кодтың негіздерін қолдану үшін оңай болып табылады. Нысан әзірлеушілер қосымша күштің мөлшерімен толық дерекқор бағдарламаларын жаза алады. Бірақ, объектті-бағытталған деректер базасы әзірлену үшін қымбат.

 Дерекқорды басқару жүйесі (ДҚБЖ) деректер үлгілерін әр түрлі негізделген деректердің базасын басқару мақсаттары үшін әзірленген компьютерлік бағдарламалық қамтамасыз ету. ДҚБЖ кешенді ұйымдастыруды бақылайды бағдарламалық жиынтық, сақтау, басқару және деректер базасына деректерді іздеу болып табылады. ДҚБЖ олардың деректер құрылымдардың немесе түрлері, кейде СУБД, сондай-ақ деректер базасы менеджері ретінде белгілерімен сәйкес жіктеледі. Төменде келтірілген деректерді басқару тапсырмалары жалпы төрт санаттарға жатады:деректер базасына енгізу.Мұндай деректерді жаңарту ескірген жазбаларды жою және деректер базасын сақтық көшірмесі ретіндегі үй шаруашылығының міндеттері.

Деректерді сұрыптау: деректер базасын ұйымдастыру немесе қайта ұйымдастыру жазбалары.Деректер жиындарын алу.т.б. төмендегі деректерді резервтік және сәйкессіздік, жақсартылған деректер тұтастығын, жақсартылғанын қамтамасыз ету үшін ДББЖ бірнеше артықшылықтары бар.

 

Қалыпқа келтіру – бірнәрсені қалыпты түрге кетіру.
Деректер базасын Қалыпқа келтіру- дерекқорды қалыпты формаға түрлендіру процесі.

Тұтастығын шектеуге жіктелуі
Реляциялық деректер базасы теориясының шектеулеріның төрт түрін ажыратуға болады:
• деректер базасына шектеу көрсетілген деректер базасын алуға рұқсат етілген мәндерге шектеу деп аталады.
• айнымалы қатынасы шектеу осы айнымалы қарым-қатынас алуға рұқсат етілген мәндерге шектеу деп аталады.
• төлсипаттық шектеу көрсетілген атрибут алуға рұқсат етілген мәндерге шектеу деп аталатын.
• Типті шектеу түрі осы түрін құрайтын құндылықтар жиынтығын анықтау болып табылады.
Айнымалы қатынасы кең тараған шектеу деңгейін мысалы әлеуетті кілті болып табылады; кең тараған деректер базасының деңгейі шектейтін сыртқы кілт болып табылады.
Дерекқордағы деректерге тұтастығы мен түпнұсқалығын
деректер базасын тұтастығының шыншылдығы (ақиқат) олардағы ақпаратты кепілдік, мүмкін емес құндылықтардан бас тартып, осы ақпаратты кем дегенде дұрыстығын қамтамасыз етпейді. Осылайша, бір деректер базасының шындық тұтастығын (консистенциясы) дерекқор шатастыруға болмайды. Негізділігі мен консистенциясы - бір нәрсе емес.
Сенімділік (немесе ақиқат) дерекқорда сақталуға тиісті фактілер. Әлбетте, деректер базасының сенімділігін анықтау үшін деректер базасын мазмұны туралы толық білім, және нақты әлемнің иелігіне талап етеді. деректер базасын тұтастығын анықтау үшін деректер базасын мазмұны туралы және оған белгіленген ережелер бойынша талап етеді. Сондықтан, дерекқордың болуы жалғыз шынайы есептілігі болуына кепілдік бере алмайды; барлық - (бұл осы шектеулерді үйлесімді емес, кез келген деректердің бар жоқ екенін қамтамасыз ету болып табылады) тұтастық шектеулерді бұзуды тудырады, кез-келген деректердің болмауын қамтамасыз ету болып табылады.

Сұранысты оңтайландыру
Деректерге қатынасу үшін қажетті мәліметтердің физикалық құрылым шарлауын қалай анықтайды. SQL деректер базасы оптимизаторлық сұрау (с рау Optimizer) деп аталады.
Қол әдісі (қатынау жолы) деп аталатын қажетті деректерді немесе қатынау үшін шарлау логикасы (алгоритм нұсқасы).
Таңдалған қатынау жолын қамтамасыз жақсартқыш арқылы істелген әрекеттер тізбегі жүзеге асыру (орындау жоспары) жоспары деп аталады.
Оңтайландыру процесі сұраулар деп аталатын қол жолдарын анықтау үшін сұрауға жақсартқыш арқылы пайдаланылатын.

 

2.SQL негіздері. Деректерді параллельді өңдеу және оларды қалпына келтіру.

Structured Query Language (Structured Query Language) - ANSI арқылы қолдау деректер базасы стандартты байланыс. Көп дерекқорлар ANSI-92 стандартты ұстанады. ANSI іс жүзінде әрбір дерекқор, синтаксисті кейбір бірегей жиынтығын пайдаланады. Синтаксис түрлі дерекқорлар үшін түрлі нәтиже әкелу жағдайлары бар, бірақ көп жағдайларда, осы синтаксис, негізгі стандартты қосымша болып табылады.

Тұтастай алғанда, «SQL деректер базасы» қатысты деректер базасын басқару жүйесінің (ДББЖ) жалпы атауы болып табылады. Кейбір жүйелер үшін, «деректер базасы», сондай-ақ басқа да, осыған ұқсас құрылымдардың бөлек ажырамас бөлігі болып табылатын кестелер тобына, деректер, конфигурация, ақпарат, жатады. Бұл жағдайда, SQL деректер базасын әрбір орнату бірнеше деректер базасынан тұруы мүмкін. Басқа жүйелер кестелер деп аталады.

Кесте - деректер жолын қамтитын бағандардан тұратын деректер базасының құрылымы. Әдетте кестелерге байланысты ақпаратты қамтиды. Дерекқорға өзі құрылуы мүмкін бірнеше кестелерді байланыстырады.

Әрбір баған атрибутбілдіреді немесе осындай қызметкері сәйкестендіру нөмірлерін, биіктігі, түсі машиналар, т.б. заттар атрибуттары, жиынтығы Жиі баған өрісі қатысты мерзімді сияқты, аты пайдаланылады «атауы өрісіне.» өрісінің сызықтары аз үстел жазба болып табылады. кестедегі әрбір баған, деректер түрі мен өлшемін нақты атауы бар. Баған атаулары кестеде ішінде бірегей болуы керек.

Әрбір жол (немесе жазба) нақты объектінің атрибуттары жиынтығы болып табылады, мысалы, жолда және т.б. қызметкердіңі ID нөмірін, оның жалақысының мөлшерін, оның туған жылы, кестелердің болуы мүмкін жолдарының аттары жоқ. Нақты сілтеу үшін, пайдаланушы анықтайтын бірнеше атрибутты (немесе атрибуттар орнату) көрсету қажет.

Ақпраттың берілгендер қорында таңдалуы сақталған деректермен жұмыс істеу кезінде орындалатын ең маңызды операциялардың бірі. Бұны орындау үшін, пайдаланушы сұрауды іске қосу керек.

Деректердің сұраныс түрлері

Деректер манипуляция тілінде (DataManipulationLanguage немесе DML) тиесілі SQL дерекқор сұрауларының төрт негізгі түрі бар:

• SELECT - кестеден жолдарды таңдау;

• INSERT - кестеге жолдарды қосу;

• UPDATE - кестеде өзгеріс жолдары;

• DELETE - кестеде жолдарды жою;

Осы сұраулардың әрбір деректері кейбір әрекетті орындау үшін пайдаланылатын әр түрлі функциялар мен операторлары бар. SELECT сұрауы опцияларды саны ең көп мұндай JOIN және Одақтың ретінде сұраулардың қосымша түрлерін таңдау қолданылады, сондай-ақ бар. Бірақ қазір, біз негізгі сұраулар ғана шоғырландыратын болады.

 

 

Қажетті деректерді алу үшін SELECT сұрауын пайдалану

Ақпарат алу үшін таңдау сұрауын пайдаланылатын дерекқорында сақталады. Бір мезгілде бірнеше кестелер үлгісін қамтамасыз ету конструкциялары бар болса осы сұраудың негізгі операциясы бір үстелмен шектеледі. нақты баған желісі үшін барлық деректерді алу үшін, осы түріне сұрау пайдаланылады:

SELECT column1, column2 FROM table_name;

Сондай-ақ, сіз қойылмалы таңбаны «*» пайдаланып кестедегі барлық бағандарды алуыңызға болады:

SELECT * FROM table_name;

Егер сіз белгілі бір жағдайда деректерді таңдау үшін қажет болған кезде WHERE шарты пайдалы болуы мүмкін. Келесі сұрау «Column1» мәні «3» болатын барлық жолдар барлық бағандарды қайтарады:

SELECT * FROM table_name WHERE column1=3;

 

 

3.Деректер қорын жобалау және құру. ORM бағдарламалау технологиясы. Үлестірілген, параллельді және гетерогенді деректер базасы.

Деректер базаларын жобалау - дерекқор схемасын жасау процесі, сондай-ақ қажетті тұтастығы шектеулерді анықтайды.

дерекқор жобалаудың негізгі міндеттері:

• барлық тиісті ақпаратты деректер базасына сақтауды қамтамасыз етіңіз.

• барлық қажетті талаптарды үшін деректерге қолжетімділігін қамтамасыз ету.

• деректерді резервтеу және қайталануын азайту.

• деректер базасын тұтастығын қамтамасыз ету.

Дерекқор дизайннің негізгі кезеңдері

Тұжырымдамалық (Infological) жобалау

Тұжырымдамалық (Infological) Дизайн - семантикалық домен моделін салу, яғни, абстракцияның жоғары деңгейлі ақпарат үлгісі болып табылады. Мұндай модель кез келген нақты деректер базасы және деректер үлгісіне назар аудара отырып құрылады. «Семантикалық моделі», «тұжырымдамалық моделі» және «infological моделі» терминдер синонимі болып табылады.

Нақты нысаны мен осы аппаратының ресми таңдауы айқындалған тұжырымдамалық моделі дерекқор мазмұны. Әдетте ER-диаграммалар сияқты графикалық белгілер пайдаланылады.

Ең жиі тұжырымдамалық дерекқор моделіне келесілер кіреді:

• доменіндегі ақпараттық объектілердің немесе ұғымдардың сипаттамасы және олардың арасындағы қарым-қатынастарды.

•шектеулер сипаттамасы яғни жарамды деректер құндылықтары мен олардың арасындағы байланыстардың қойылатын талаптары болып табылады.

 

Логикалық жобалау

Логикалық жобалау - нақты деректер үлгісіне негізделіп дерекқор схемасының құру, деректер үлгісі ретінде әдетте бастапқы кілті бар қарым-қатынастардың схемаларының жиынтығы, сондай-ақ шетелдік кілттерін білдіретін қарым-қатынас арасындағы «байланыс» - реляциялық деректер модель

Логикалық моделін тұжырымдамалық моделіне түрлендіру, әдетте, ресми ережелер бойынша жүзеге асырылады. Бұл қадам, негізінен автоматтандырылған болуы мүмкін.

Логикалық жобалау кезінде назарға нақты деректер моделінің ерекшеліктерін қабылдайды, бірақ ол назарға нақты ДББЖ-ың ерекшеліктерін қабылдай алмайды.

Физикалық жобалау

Физикалық жобалау - нақты ДББЖ үшін дерекқор схемасының құру. нақты ДББЖ ерекшелігі дерекқор нысандарының атауының қатысты шектеулерді қамтитын қолдау деректер түрлері бойынша шектеулер және т.б.. Физикалық жобалау кезінде нақты деректер базасының ерекшелігі дискі жады басқару әдістерін таңдау (физикалық жинақтаушыға байланысты таңдау шешімдер кіреді дерекқор файлы мен құрылғылардың бөлу, деректерге қатынау әдістері), индекстер жасау және т.б..

 

ORM деген не?

ORM немесе нысан-реляциялы (rus.Obektno-реляциялық) - сіз деректерді сақтау және бағдарламалық қамтамасыз ету объектілерінің арасындағы, атап айтқанда, ООП модельдерді сыйыспайтын түрлерін түрлендіруге рұқсат беретін бағдарламалау әдісі болып табылады. ORM Реляциялық деректер базасында және шығарып алу үшін нысандарды үнемдеу процесін жеңілдету үшін пайдаланылады. ORM дерекқор және қолдануы бастапқыда жұмыс істей аласыз, онда сондай-ақ әзірленген қосымшаларды, міндеттерді толық бөлу қарастырылған.

Сурет 3- ORM жұмысы

 

ORM принципі

ORM басты ерекшелігі дерекқорда оның деректерге нысанды салыстыру үшін пайдалану картасы болып табылады. ORM ол жадта «виртуалды» дерекқор схемасын жасауға мүмкіндік береді. Нысанды және оның қасиеттерін көрсететін бір немесе бірнеше кестелер мен дерекқорда өрістермен байланыстырылады. ORM базасы мен нысанның пішіні арасындағы деректерді түрлендіру процесін бақылауға, SQL-сұрауларды жасау үшін жаңартуды пайдаланады.

 

Үлестірілген деректер базасы - физикалық компьютерлік желіде таратылатын логикалық байланысты деректердің жиынтығы (және олардың сипаттамасы). Үлестірілген дерекқорлар үшін әзірленген ДҚБЖ -Software жүйесі және сіз соңғы пайдаланушыға ақпаратты таратуғамүмкіндік береді.

Пайдаланушылар үлестірілген қолдану арқылы деректер базасымен өзара байланыста. Бағдарламалар басқа сайттар (жергілікті бағдарлама) бойынша деректерге талап етпейді, мұндай кiру (жаһандық өтініш) талап ретінде жіктелуі мүмкін.

 

Реляциялық деректер базасымен объектілі-бағытталған өтініштері интеграция гетерогенді ақпараттық жүйелерді дамыту болып табылады. Гетерогенді ақпараттық жүйелер, кейде, (схемасын) нормаланған (тұрақты болуына) құрылымдалған, жартылай құрылымдалған және құрылымдалмаған гетерогенді деректер көздерінің ықпалдасуы. Кез келген гетерогенді ақпараттық жүйе әр түрлі деректер қорын және бай функционалдық сақталған деректерге пайдаланушылар схемасының артықшылықтарын алуға, сондықтан, дерекқор компоненттерін жаһандық дерекқор схемасы бойынша салынған, яғни бірыңғай интерфейстер (мысалы, SQL-стилі интерфейс) болып табылады. Мұндай гетерогенді ақпараттық жүйесі бірлескен көп деректер база жүйесі деп аталады.

Деректер базасын басқару жүйелері (МББЖ) қалыптастыру үлестірілген есептеу технологиясын дамытуда елеулі табыстарға және параллель өңдеуде тұспа-тұс келді. Нәтижесінде, кез келген бөлінген деректер базасын басқару жүйелері және параллель дерекқор басқару жүйесі. Бұл жүйелер деректер ететін бағдарламаларды құру құралы бола бастады.

Параллель Компьютер немесе Көппроцессорлы өзі жалпы тұрғын үй шегінде жылдам желіге қосылған компоненттерінен (процессорлар, жады компоненттері) тұратын таратылған жүйесі болып табылады. Таратылған деректер базасының технологиясы қайта қаралған және деректер базасы жүйелері параллель ұзартылуы мүмкін, параллель компьютерлерде яғни Database жүйелерінде.

Үлестірілген және параллель деректер базасын, деректер түйіндер желісіне немесе многопроцессорлы жүйесі бойынша таратылады, жұмыс фактісін қоспағанда, орталықтандырылған деректер базасын бірдей функционалдық қамтамасыз етеді.

 

Сұрақтар:

1. Дерекқорлардың қазіргі өмірде осындай маңызды болуының себебі неде?

2. Дерекқорларды тұтынушылық мінез-құлықты болжау үшін пайдалануға бола ма?

3. Деректер базасының негізгі компоненттері қандай?

4. Неге байланыс деректер базасының айтарлықтай аспектісі болып табылады?

5. Файлдар және басқа дерекқор модельдері арасында қандай айырмашылық бар?

Дәріс №6. Деректерді талдау. Деректерді басқару.

Мақсаты: регрессияның корреляциялық тұжырымдамасы туралы жалпы түсінік беру, сондай-ақ статистикаға сипаттама.

Жоспары:

1.Деректерді талдау негіздері.

2.Жинау, жіктеу және болжау әдістері. Шешімдер ағаштары. Үлкен көлемді деректерді өңдеу.

3.Data Mining әдістері мен кезеңдері. Data Mining міндеттері. Деректерді визуализациялау.

1.Деректерді талдау негіздері.

Бұл дәрісте біз деректердің статистикалық талдауының кейбір аспектілерін қарап шығамыз, атап айтқанда, сипаттамалық статистика, корреляциялық және регрессиялық талдау. Осы дәрістің мақсаты - регрессияның корреляциялық тұжырымдамасы туралы жалпы түсінік беру, сондай-ақ статистиканың сипаттамасымен танысуға арналған. Дәрістегі мысалдар оңайлатылған.

Сондай-ақ, қолданбалы пакеті немесе құралдар жиынтығы деп аталатын статистикалық әдістердің кең ауқымын жүзеге асыруға арналған бағдарламалық пакеттер бар. Microsoft Excel бағдарламасында сондай-ақ, математикалық статистикалық әдістерін жүзеге асыруға осы дәрістің мысалдарын жүзеге асыруға қолданбалы бағдарлама қамтамасыз етілген.

Статистикалық сипаттама

Статистикалық сипаттама - қабылдау және талқылау үшін түсінікті түрге сандық деректер массасын түрлендіру үшін сандық деректерді біріктіру әдістемесі пайдаланылады.

Сипаттама статистиканың мақсаты - эксперименттер және бақылау нәтижесінде алынған бастапқы қорытындысын корреляциялық түрде талдау.

Корреляциялық талдау

 Корреляциялық талдау өлшемсіз түрінде ұсынылған деректердің екі комплект қарым-қатынасын сандық түрде пайдаланады. Деректер байланысындағы мәнінің орнатуын анықтауға мүмкіндік береді. Корреляция коэффициенті әрқашан R латын әрпімен белгілененіп, екі қасиеттері арасындағы өзара байланысы бар екендігін анықтау үшін пайдаланылады.

Белгілердің (Шкала Cheddok бойынша) арасындағы қатынастары күшті, орташа және әлсіз болуы мүмкін. Байланыстың жақындығын -1-ден +1 ге дейінгі мәнін қабылдайтын корреляция коэффициентінің шамасымен анықталады. Кеста 7 көрсетілген байланыс жақындығына бағалау критерийлері көрсетілген.

Кесте 7- Сандық өлшемдердің байланысты- жақындығын бағалау

Пирсонның Корреляция коэффициенті

Пирсон корреляция коэффициенті R -1.0-ден 1.0 диапазонындағы өлшемсіз индексі деректерді екі жиыны арасындағы сызықтық тәуелділігі дәрежесін білдіреді.

Екі белгілері арасындағы байланыс көрсеткіш жақындығы сызықтық корреляция коэффициенті бойынша анықталады:                                                 мұндағы

х - фактор көрсеткішінің мәні;

у - алынған нәтижесінің мәні;

N - деректердің жұп саны.

Жұп корреляциясы - екі таңбаның (тиімді және факторлық немесе екі факторлық) арасындағы байланыс

Таңбалардың арасындағы сызықтық қарым-қатынастың болуын немесе болмауын сипаттайтын байланыс нұсқалары:

• басқа да жиынтық (оң корреляциялық) үлкен мәндермен байланысты деректердің бір жиынтығындағы жоғары мәндерінде - тікелей сызықтық байланыс бар;

• бір жиынтық шағын маңызы басқа (теріс корреляция) үлкен мәндерімен байланысты - теріс желілік қарым-қатынаста болуы;

• екі полигондардың деректерімен (нөлдік корреляциялық) байланысты емес.

Мысал ретінде, деректер жиынтығы 7- кестеде. Ол х және у белгілері арасындағы желілік екенін анықтау үшін қажет.

айнымалылар х және у үшін тиісті ось координат жүйесінде пайдаланылатын екі айнымалылар арасындағы қатынастардың Графикалық дисперсия диаграмма деп аталады, ол 7 - кестеде көрсетілген.. Бұл диаграмма айнымалы х төмен мәні айнымалы у төмен мәндерге сәйкес екенін көрсетеді, х жоғары құндылықтар айнымалы у жоғары құндылықтарына сәйкес келеді. Бұл мысал айқын қарым-қатынасты көрсетеді.

Сурет 4- Нүктелік диаграмма

Осылайша, біз айнымалылар х және у арасындағы қарым-қатынасты орната алады. Біз MS Excel PEARSON (массив 1, массив 2) функциясының көмегімен екі массивтердің (х және у) арасындағы Пирсон корреляция коэффициентін есептеп берушінің нәтижесі корреляциялық коэффициентінің мәні, яғни 0.998364 тең болып, айнымалылар х және у арасындағы қарым-қатынастар өте жоғары болып табылады. MS Excel талдау пакеті және «корреляциялық» талдау құралын пайдалана отырып, біз корреляциялық матрицаны құрамыз.

Мөлшері мен сенімділіктегі айнымалылар арасындағы кез келген қарым-қатынас екі маңызды сипаттамалары бар. Екі айнымалы арасындағы қарым-қатынастар, үлкен тәуелділігін және оңайырақ басқа айнымалысы бар айнымалы мәнін болжау болып табылады.

Сенімділік тәуелділігі маңызды, оның саны артық. Бұл сипат зерттеу үлгідегі репрезентативтікке байланысты. қарай Сенімділік, бұл тәуелділіктің қайтадан басқа деректерден табылған.Тәуелді айнымалы сенімділік құнының өсуін әдетте бірге арттырады.

Регрессиялық талдау

Негізгі регрессиялық талдау ерекшелігі: нақты ақпарат қандай нысанда және оқыған айнымалылар арасындағы қарым-қатынас сипатында, оның көмегімен алуға болады.

Регрессиялық талдау тізбегі

Қысқаша регрессиялық талдау қадамдарын қарастырайық.

1. Ақаулық мәлімдемесі. Бұл кезеңде, зерттелген құбылыстардың тәуелділігі туралы алдын ала гипотезаны қалыптасады.

2. Тәуелді және тәуелсіз (түсіндірме) айнымалыны анықтау.

3. Статистикалық деректердің жинағы. Регрессиялық модель енгізілген айнымалылардың әрқайсысы үшін деректер жиналуы керек.

4. Байланыс нысан болжамдарының (қарапайым немесе бірнеше сызықтық немесе сызықтық) тұжырымдамасы.

5. Регрессия функциясының анықталуы (регрессиялық теңдеудің параметрлерін сандық мәндерді есептеу үшін болып табылады)

6. Регрессиялық талдау нәтижелерінің дәлдігін бағалау.

7. Түсіндірме нәтижесінде алынған регрессиялық талдау нәтижелері бойынша алдын ала болжамдарын салыстырылады. Нәтижелердің дәлдігі мен нақтылығы бағаланады.

8. Тәуелді айнымалының белгісіз құндылықтарын болжау.

 Болжау және жіктеу проблемасына ықтимал шешімін регрессиялық талдауда пайдалану. Болжамды мәндері регрессия теңдеуі параметрлерінің түсіндірме айнымалылар ішіне алмастыру арқылы есептеледі. Төмендегідей жіктеу тапсырманың шешімі бойынша жүзеге асырылады. Регрессия желісі екі топқа нысандардың бүкіл жиынтығын бөледі, және функция мәні нөлден артық болып жиынтығының бөлігі сол класқа жатады, және ол нөлден кем болып табылатын болса онда ол басқа класта.

2.Жинау, жіктеу және болжау әдістері. Шешімдер ағаштары. Үлкен көлемді деректерді өңдеу.

Жіктелуі. Жіктеуді нақты класта анықтау үшін атрибуттар санын сипаттайтын тұтынушы өнімнің немесе объекті түрінің идеясын алу үшін пайдаланылуы мүмкін. Мысалы, автомобильдер оңай түрлі атрибуттарды (орындық, дене стилі, жетекші дөңгелектер) анықтайтын түрі (седан, SUV, айырбасталатын) бойынша жіктеледі. Жаңа автокөлікті зерттеу, сіз сондай-ақ белгілі анықтамаға сәйкес атрибуттарын салыстыру арқылы белгілі бір класқа оны қабылдауыңызға болады. Сол принциптерді сатып алушыларға мысалы, жасына және әлеуметтік топқа жіктеп қолдануға болады.

Сонымен қатар, басқа да жіктеу әдістерін кіріс ретінде пайдаланылуы мүмкін. Мысалы, сыныптау шешімінің ағашына жатқызуға болады.

Болжам - бұл алаяқтықты анықтау үшін аппараттық құрамдас ақаулықтары созылып жатқан кең тақырып болып табылады, тіпті компанияның пайда болуын болжауға. деректер тау-кен болжау басқа әдістермен ұштастыра трендті талдау, жіктеу, іріктеу және модель қатынастарын қамтиды. Өткен оқиғалар немесе элементтерді талдау арқылы сіз болашақты болжауыңызға болады.

Мысалы, несиелік карта авторизациялау туралы деректерді пайдалана отырып, сіз алаяқтық операцияларды анықтау үшін тарихи өрнектермен жіктеу және салыстыруын операциялардың шешім ағаш талдауымен біріктіруге болады. АҚШ-тағы авиабилеттерді сатып алу АҚШ-тағы транзакцияға сәйкес келе, бұл операциялар шынайы емес болуы мүмкін.

Шешім ағаштары.

Шешім ағаш әдісі (шешім ағаштары) жіктеу және болжау проблемаларын шешу үшін ең танымал әдістерінің бірі болып табылады. Кейде бұл әдіс, сондай-ақ Data Mining ағаштары шешім ережелерін, жіктеу және регрессиялық ағаштары деп аталады.

Осы әдісті пайдалана отырып жіктеу және болжау мәселесін шешуге болады.

Тәуелді айнымалы үздіксіз мәндер қабылдаса, онда шешім ағаш тәуелсіз айнымалы, яғни осы айнымалы тәуелділігін белгілейді. Ол ауа райының сандық болжау мәселесін шешеді.

Шешім ағашы қарапайым түрінде - бұл иерархиялық, келісілген құрылымындағы ережелерін білдіретін бір жол болып табылады. Осы құрылымның негізі - бірқатар мәселелер бойынша жауап «Иә» немесе «Жоқ».

Сурет 4 шешім ағашы мысалға келтірілген - «гольф ойыны ма?» мәселені шешуғе арналған сұраққа жауап: (бұл жағдайда «Ойнау» немесе «ойынамау»), ағымдағы жағдай белгілі сыныптардың біріне жатқызылуға тиіс. Ағаштың түбінен бастап барлық сұрақтарға бірқатар жауап талап етіледі.

Түбінен өту нәтижесінде (кейде түбір түйіні деп аталады), оның жоғарғы жіктеу проблемасы шешіледі, біреуін таңдаңыз - «ойнау» және гольф «ойнауға болмайды».

Сурет 5- «Гольф ойнаймыз ба?» шешім ағашы

Интуитивті шешім ағаштар. шешім ағаштан түрінде ұсынылған жіктелу моделі шешілуде проблеманың интуициялық түсінігі жеңіл түсіну болып табылады. Шешім ағаштар алгоритмдерін жобалау нәтижесі, керісінше, мысалы, «қара жәшіктер» болып табылады, нейрондық желілерді пайдаланушы оңай түсінуіне болады. Тұтастай алғанда жіктеу моделін түсіндіру жаңа нысанның нақты сыныбына сілтеме, сондай-ақ интерпретация кезінде пайдалы. Бұл шешім ағаштары бізге неге нақты обьект осы не басқа класқа жататынын түсінуге мүмкіндік береді.

Ағаш алгоритмі жобалық шешімдер енгізу атрибуттарын (тәуелсіз айнымалылар) таңдау үшін пайдаланушыға талап етілмейді. Алгоритмді енгізу қолданыстағы барлық атрибуттарға берілуі мүмкін, алгоритм олардың арасында ең маңыздысын таңдайды, және тек олар ағаш салу үшін пайдаланылатын болады. Кіріс таңдау атрибуттары нейрондық желілер сомасы айтарлықтай оқыту уақытын салыстырғанда, нейрондық желілер, мысалы, осы пайдаланушы жұмысын жеңілдетеді.

Шешім ағаштарды пайдаланып жасалған модельдер дәлдігі, модельдерді жіктеу, (статистикалық әдістер, нейрондық желілер) салу, басқа да әдістеріді салыстыруға болады.

Өте ауқымды деректер базасы туралы шешім ағаш салу үшін масштабталатын алгоритмдердің бірқатарын; мұнда ауқымдылығы, яғни, мысалдар немесе деректер базасына саны артуда оқыту жұмсалған уақытты жазады, бұл шешім ағаштарды құру, сызықтық өсуде пайдалануға болады. Мұндай алгоритмдер мысалдарына: SLIQ, СПРИНТ айтамыз.

Деректердің үлкен көлемін өңдеу.

«Big Data» термині - ағылшын терминінің калькасы. Big Data –ның қатаң анықтамасына жоқ. Ол нақты шектеу жүргізу мүмкін емес - 10 Терабайт, немесе 10 мегабайт? дегеннің өзі өте субъективті болып табылады. «Көп» сөзі – бұрынғы тайпалардың арасындағы «көптеген бір, екі,» ретінде болып табылады.

Үлкен деректер деп - үш операцияларды орындау үшін жасалған технологиялардың жиынтығы. Біріншіден, «стандартты» деректер көлемі сценарийлерімен салыстырғанда үлкен айлалы. Екіншіден, өте үлкен көлемде кіріс деректермен тез жұмыс істеуге қабілетті болуы үшін. Бұл деректер тек көп емес, және олар үнемі көбірек болып отыр. Үшіншіден, олар әр түрлі аспектілері бойынша параллель құрылымдық және нашар құрылымдық деректермен жұмыс істеуге қабілетті болуы тиіс. Ірі деректерді енгізу ағыны алгоритмдері әрқашан ақпаратты құрылымдалған және ол бір емес, бірнеше идеядан алынатын болады деп емес, алынған деп болжайды.

Қоғамдық кеңістікте үлкен деректердің пайда болуы осындай проблемалармен ұзақ уақыт бойы шешіп жүргендерді ғана емес (ғылыми қоғамдастық),бұл деректер барлық адамдарды қобалжытты. Планетаның тұрғындарының саны - бұл өте нақты саныға жете бастағанда қоғамдықға Big Data технологиясы келді. YouTube, Facebook -та адамдардың саны миллиардтаған. ВКонтакте оларды бір уақытта орындау мәмілелер саны көп. Бұл жағдайда деректер ағыны пайдаланушының іс-қимылы. Мысалы, сол YouTube хостингідегі деректер. 

Талдау үшін пайдаланылатын ірі тәсілдерге қатысты деректері көп, шын мәнінде өте ұзақ. Мысалы, бейнебақылау камералары арқылы суреттерді өңдеу, бір сурет емес, көп деректер ағыны туралы айтып тұрмыз. Немесе роботтардың шарлауы. Осының бәрі ондаған жылдар бойы болған, дәл қазір адамдарға деректерді өңдеу міндеттері әлдеқайда көп әсер етеді.

Көптеген жасаушылар статикалық объектілермен жұмыс істеуге үйренген. Өөзге де деректерде парадигма үлкен. Сіз үлкен деректер ағынымен жұмыс істеуге қабілетті болуыңыз тиіс, және ол қызықты, күрделі міндет болып табылады. Ол көп аймақ бағыттарын қамтиды.

Біздің өмірімізде аппараттық және бағдарламалық деректер көп деректерді өңдеуді бастап отыр - мысалы, «заттар интернеті».

Заттар ақпараттың үлкен ағынын генерациялап жатыр. Полиция жүйесі «ағыны» барлық камераларынан ақпараттар жібереді және осы деректер бойынша машинаны табуға мүмкіндік береді. Фитнес -білезіктер, GPS-трекерлер және адам тапсырмаларын және бизнес қызметін көрсететiн басқа да заттар сәнге кірді.

3.Data Mining әдістері мен кезеңдері. Data Mining міндеттері. Деректерді визуализациялау.

Барлық Data Mining әдістері бастапқы оқыту деректермен жұмыс кезінде екі үлкен топқа бөлінеді. Осы классификацияда Data Mining-нан кейін деректер сақталады ма деген негізде жоғарғы деңгей анықталады. 

1. Деректерді тікелей пайдалану немесе деректерді сақтау.

Бұл жағдайда, бастапқы деректерді тікелей болжамды модельдеу қадамдары және / немесе талдау ерекшеліктер толық және айқын сақталады. әдістерін Осы топпен мәселе - оларды пайдаланудың өте үлкен деректер базасының күрделі талдауы болуы мүмкін.

Осы топтың әдістері: кластерлік талдау, ең жақын көрші әдісі, K-жақын көрші әдісі, ұқсас пайымдау.

2. Формальды заңдар немесе дистиляция  үлгілерін анықтау пайдаланады.

Дистиляция үлгілер технологиясы кезінде ақпараттың бір үлгісі өңделмеген деректерден алынады, оның нысаны Data Mining әдісіне байланысты белгілі бір формальды құрылымына айналады. Бұл процесс жоқ, негізінен, осы әдістің алғашқы топтық кезеңінде тегін іздеу сахнасында жүзеге асырылған. Сахнада болжалды модельдеу және талдау нәтижелері еркін іздеу ерекшеліктер кезеңін пайдаланылады, олар әлдеқайда көп жинақы дерекқорлар болып табылады. Бұл модельдердің құрылысы талдаушы немесе бағыттаушы («қара жәшіктер») арқылы түсіндіруге болатынын еске саламыз.

Data Mining статистикалық әдістері

Бұл әдістер өзара байланысты төрт бөлімдерден тұрады:

• статистикалық берілгендердің алдын ала талдау (стационарлық сынау гипотезалар, қалыпты, тәуелсіздік, біртектілік, тарату функциясын бағалау, оның параметрлері және т.б.) табиғаты;

• сілтемелер мен үлгілерін анықтау (сызықты және сызықты емес регрессиялық талдау, корреляциялық талдау және басқалар.);

• көп статистикалық талдау (сызықтық және сызықтық емес дискриминантты талдау, кластерлік талдау, компоненттік талдау, факторлық талдау және басқалар.);

· Динамикалық модель және болжамы қатардың уақытына негізделген.

Data Mining статистикалық әдістер арсенал әдістері төрт топқа жіктеледі.

:

1. Сызба талдауы және бастапқы деректердің сипаттамасы.

2. Байланыстың талдауы (корреляциялық және регрессиялық талдау, факторлық талдау, дисперсиялық талдау).

3. Көпсатылы статистикалық талдау (компоненттік талдау, дискриминанттық талдау, көпөлшемді регрессиялық талдау, канондық корреляция, және басқалар.).

4. Қатарлардың уақытша талдауы (динамикалық моделдеу және болжам).

Data Mining кибернетикалық әдістері

Деректердің екінші бағыты - компьютерлік математика және жасанды интеллект теориясын пайдалану идеясы біріктіретін әртүрлі тәсілдер болып табылады.

Осы топ мына әдістеріді қамтиды:

• жасанды нейрондық желілерді (тануды, кластеризациялық болжау);

• эволюциялық бағдарламалау (аргументтердің тобы шотына алгоритмдер әдісін қоса алғанда);

• генетикалық алгоритмдер (оңтайландыру);

• ассоциативті жады (іздеу аналогтар, прототипі);

• айқын логика;

• шешім ағаштары;

• сараптамалық білімді өңдеу жүйелері.

Data Mining әдістерін  Data Mining міндеттеріне сәйкес жіктеуге болады.

Осы жіктеуге сәйкес екі топты қарастырамыз. Олардың біріншісі - сегменттеу (жіктеу және кластерлеу мәселесіне) және болжау тапсырма проблемасын шешуге арналған Data Mining әдістері бөлімі. Екінші тобы бойынша міндеттерге сәйкес Data Mining әдістерін сипаттама және болжамды қорытындысы бойынша бағытталады.

Сызба әдістерін талдаушы тұрғысынан түсіндіру үшін бейімделген деректерді сипаттау үлгілерін табу үшін пайдаланылады.

Талдау сипаттама нәтижелерін алуға негізделген әдімтерге итерациялық кластерлік талдау әдістері болып табылады, оның ішінде Л- алгоритм, K-орташа,, Коско өзін-өзі ұйымдастыру карталары, иерархиялық кластерлік талдау әдістері, кросс-кестелік визуализация әдістері, әр түрлі бейнелеу тәсілдері және т.б.: сипаттама алуға бағытталған әдістерін қоса алғанда,

Болжалды әдістері белгісіз болжау / болжау үшін кейбір айнымалылардың мәндерін (хабар-ошарсыз кеткен) немесе өзге де (мақсатты) айнымалылардың мәндерін болашақта пайдаланыңыз.

Болжалды нәтижелер алуға бағытталған әдістер, мысалы, нейрондық желілер сияқты әдістер, шешім ағаштары, сызықтық Регрессия, жақын көршісі, қолдау вектор машиналары және басқалар.

3.Data Mining әдістері мен кезеңдері. Data Mining міндеттері. Деректерді ви


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: