Почетна » како да » Како (и зашто) користити функцију Оутлиерс у Екцелу

    Како (и зашто) користити функцију Оутлиерс у Екцелу

    Оутлиер је вриједност која је значајно виша или нижа од већине вриједности у вашим подацима. Када користите Екцел за анализу података, оутлиери могу искривити резултате. На пример, средња вредност скупа података заиста може да одражава ваше вредности. Екцел пружа неколико корисних функција које вам помажу да управљате својим оутлиерима, па погледајмо.

    Брзи пример

    На слици испод, оутлиери су релативно лако уочити - вредност два додељена Ерицу и вредност 173 додељена Риану. У скупу података као што је овај, довољно је лако уочити и ријешити те екстреме ручно.

    У већем скупу података то неће бити случај. Важно је бити у стању идентифицирати екстреме и уклонити их из статистичких израчуна - и то је оно што ћемо гледати како то учинити у овом чланку.

    Како пронаћи отказе у вашим подацима

    Да бисмо пронашли екстреме у скупу података, користимо следеће кораке:

    1. Израчунајте први и трећи квартил (причамо о томе шта је то само мало).
    2. Процијените интерквартилни распон (ово ћемо такође објаснити мало ниже).
    3. Вратите горњу и доњу границу нашег опсега података.
    4. Употријебите ове границе за идентификацију удаљених података.

    Распон ћелија десно од скупа података који се види на слици испод ће се користити за чување ових вредности.

    Хајде да почнемо.

    Први корак: Израчунајте квартиле

    Ако поделите податке на четвртине, сваки од тих скупова се назива квартил. Најнижи 25% бројева у распону чине први квартил, следећих 25% други квартил, и тако даље. Овај корак најприје користимо зато што је најчешће кориштена дефиниција оутлиер-а податковна точка која је више од 1,5 интерквартилних распона (ИКР) испод првог квартила, а 1,5 интерквартилних распона изнад 3. квартила. Да бисмо одредили те вредности, прво морамо да схватимо шта су квартили.

    Екцел обезбеђује КУАРТИЛЕ функцију за израчунавање квартила. Захтева два податка: поље и кварт.

    = КУАРТИЛЕ (низ, кварт)

    Тхе арраи је опсег вредности које вреднујете. И то кварт је број који представља квартил који желите да вратите (нпр. 1 за 1ст квартил, 2 за други квартил, и тако даље).

    Белешка: Мицрософт је у програму Екцел 2010 издао функције КУАРТИЛЕ.ИНЦ и КУАРТИЛЕ.ЕКСЦ као побољшања функције КУАРТИЛЕ. КУАРТИЛЕ је више компатибилан када радите на више верзија програма Екцел.

    Вратимо се на наш пример.

    За израчунавање 1ст Квартил можемо користити следећу формулу у ћелији Ф2.

    = КУАРТИЛЕ (Б2: Б14,1)

    Када унесете формулу, Екцел нуди листу опција за куарт аргумент.

    За израчунавање 3рд квартил, можемо унијети формулу као што је претходна у ћелији Ф3, али користећи три умјесто једне.

    = КУАРТИЛЕ (Б2: Б14,3)

    Сада имамо квартилне тачке података приказане у ћелијама.

    Други корак: Процијените интерквартилни распон

    Интерквартилни опсег (или ИКР) је средњи 50% вредности у вашим подацима. Израчунава се као разлика између вредности првог квартила и вредности трећег квартила.

    Користићемо једноставну формулу у ћелији Ф4 која одузима 1ст квартил од 3рд квартил:

    = Ф3-Ф2

    Сада можемо да видимо наш интеркартилни распон.

    Трећи корак: Вратите доњу и горњу границу

    Доња и горња граница су најмање и највеће вредности опсега података које желимо да користимо. Све вриједности мање или веће од ових везаних вриједности су екстремне вриједности.

    Ми ћемо израчунати доњу границу ограничења у ћелији Ф5 множењем ИКР вредности са 1.5 и онда је одузети од К1 тачке података:

    = Ф2- (1,5 * Ф4)

    Белешка: Заграде у овој формули нису неопходне зато што ће се део множења израчунати пре дела за одузимање, али они чине да формула буде лакша за читање.

    Да бисмо израчунали горњу границу у ћелији Ф6, помножимо ИКР поново за 1,5, али овај пут додати до тачке података за К3:

    = Ф3 + (1,5 * Ф4)

    Четврти корак: Идентификујте екстремисте

    Сада када имамо све наше основне податке, време је да идентификујемо наше тачке података - оне које су ниже од доње граничне вредности или више од горње граничне вредности.

    Користићемо функцију ОР за извођење овог логичког теста и приказати вриједности које задовољавају ове критерије уносом сљедеће формуле у ћелију Ц2:

    = ИЛИ (Б2 $ Ф $ 6)

    Онда ћемо копирати ту вредност у наше Ц3-Ц14 ћелије. ТРУЕ вриједност означава оутлиер, и као што можете видјети, имамо двије у нашим подацима.

    Игнорисање оутлиера када се израчунава средња вредност

    Користећи функцију КУАРТИЛЕ израчунајмо ИКР и радимо са најчешће употребљаваном дефиницијом оутлиера. Међутим, при израчунавању средњег просјека за распон вриједности и игнорирање оутлиера, постоји бржа и лакша функција. Ова техника неће идентифицирати оутлиера као раније, али ће нам омогућити да будемо флексибилни с оним што бисмо могли узети у обзир наш оутлиер дио.

    Функција која нам је потребна зове се ТРИММЕАН, а испод ње можете видјети синтаксу:

    = ТРИММЕАН (низ, проценат)

    Тхе арраи је опсег вредности које желите да просечите. Тхе проценат је проценат тачака података које треба искључити од врха и дна скупа података (можете да га унесете као проценат или децималну вредност).

    Доњу формулу смо унели у ћелију Д3 у нашем примеру да бисмо израчунали просек и искључили 20% оутлиера.

    = ТРИММЕАН (Б2: Б14, 20%)


    Тамо имате две различите функције за руковање екстремима. Без обзира да ли желите да их идентификујете за неке потребе извештавања или да их искључите из калкулација као што су просеци, Екцел има функцију која одговара вашим потребама.