Статистичка анализа: Врсте података

Такође видети: Разумевање корелација

Наша страница на Посматрачка истраживања и секундарни подаци описао два главна извора података (ваше сопствено истраживање и подаци који су претходно објављени). Међутим, постоји и много различитих врста података - а подаци се могу класификовати на неколико различитих начина. Врста података ће утицати на начине на које их можете користити и које статистичке анализе су могуће. Такође ће утицати на закључке и закључке које можете извући.

Избор типа података је зато веома важан. Ова страница описује неке разлике у типовима података и импликације на истраживачке методе и налазе.

Квантитативни наспрам квалитативних података

Прва и најочигледнија разлика је између квантитативних и квалитативних података:





  • Квантитативни подаци су нумерички: могу се прикупити и представити као бројеви; и

  • Квалитативни подаци нису нумеричке.

Наша страница на квалитативна и квантитативна истраживања детаљније објашњава ову разлику и износи предности и недостатке оба.

Објективни наспрам субјективних података



Подаци се такође могу поделити на објективни и субјективни.

  • Објективни подаци су видљиви и мерљиви . Укључују ствари попут висине, тежине или броја елемената. Обично се прикупљају посматрањем или директним мерењима.

  • Субјективни подаци се прикупљају из личних комуникација појединаца . Ово се може говорити или писати, али може имати и друге облике. На пример, говор тела може пружити субјективне информације („ Лежала је мирно, затворених очију и стиснутих уста [објектив], као да је боли [субјективно] ”).



Објективни и субјективни подаци могу бити и квалитативни и квантитативни. На пример, можете уочити (објективну) промену боје (квалитативну) и можете тражити од људи да изразе своје мишљење о неком питању (субјективно) помоћу нумеричке скале (квантитативне).

Обе врсте имају предности и недостатке. На пример, субјективни подаци могу пружити много шири спектар информација, јер су многе ствари једноставно немерљиве. Ту спадају променљиве попут нивоа бола, где свако има своје тумачење. Чак и коришћење скале од 1 до 10, која чини податке квантитативним, не значи да ће бити директно упоредиви између појединаца.

Међутим, субјективни подаци такође зависе од тога да ли људи памте и прецизно процењују ствари. Субјективни подаци су стога вероватно непоузданији када људи морају да се сећају догађаја из давних времена.



Стога су, тамо где је то могуће, пожељни објективни подаци, али постоји опште разумевање да су понекад доступни само субјективни подаци.



Уздужни наспрам пресека

Разлика између лонгитудиналних података и података попречног пресека заправо је већа разлика у дизајн студија него тип података.

  • Лонгитудиналне студије радити са истом групом током времена. Стога могу показати промене током времена и идентификовати узрочност.

  • Студије пресека могу прикупљати податке у различитим временским периодима, али из различитих група. Стога они могу само на време приказати снимак или серију снимака.

Кључна разлика између две врсте студије, а самим тим и података, је та што лонгитудинални подаци могу показати узрочност.

Генерално се сматра немогућим доказати узрочност на основу података пресека, јер имате само информације о тренутку. Стога није могуће нешто променити и видети какав ефекат то има (то јест, ако постоји узрочна веза ).

Међутим, студије пресека су много погодније. Морате да обавите само једно истраживање или део истраживања, уместо да следите кохорту током времена. Лонгитудиналне студије могу дати врло висококвалитетне податке и показати узроке, али пате од проблема као што је напуштање кохорте. Такође је тешко добити средства за дугорочне, висококвалитетне лонгитудиналне студије.

Пример: Комбиновање попречног пресека и лонгитудиналног истраживања


Тхе Сурреи Цоммуницатион анд Лангуаге ин Едуцатион Студи (СЦАЛЕС ) је добар пример дугорочне лонгитудиналне студије, која је такође обухватила неке елементе пресека.

Први елемент студије било је велико истраживање деце у години пријема у 180 основних школа у Сурреи-у. Сва деца у популацији су на улазу у школу прегледана за језичке способности путем анкете коју су за свако дете попунили одељенски старешине. Питани су о понашању, језику и социјалним вештинама. Ово је дало кратак преглед језичких способности приликом уписа у школу и омогућило истраживачима да процене да ли се наставни план и програм подударају са способностима и утврде да је вероватноћа да ће млађа деца имати језичке проблеме.

Следећа фаза је одабрала узорак од 590 деце од оне која је прегледана, стратификовану користећи налазе из прве фазе како би се добио низ језичких способности. Истраживач их је видео 1. године, и поново 3. године, и проценила њихове језичке вештине. Од родитеља се такође тражило да пруже информације о језику и понашању у обе тачке.

Следећа фаза пратила је оригиналну КОХОРТУ КОХОРТА у 6. и 8. години, како би се проценили њихови социјални, емоционални и ментални резултати.

Истраживаче је занимала веза између језичког развоја у раном детињству и социјалног и емоционалног развоја у адолесценцији. Ова врста информација једноставно се не може прикупити из студије пресека или из две одвојене студије у различитој старости. Можете замолити учеснике и родитеље да се размисле, али временски размак је такав да сећање вероватно није поуздано.

Категорични, континуирани, дискретни и рангирани подаци

Друга разлика су категорични, континуирани, дискретни или рангирани подаци:

  • Категорички подаци су подељени у различите групе или категорије .

    Стога укључују, на пример, пол, волите ли сладолед и јесте ли икада посетили одређену земљу. Такође могу укључити старост ако је груписана у десетогодишње или петогодишње делове.

  • Континуирани подаци су дефинисани као они који могу да узимају бесконачан број вредности између било које две вредности.

    Ово звучи компликовано, али је заправо једноставно. То су подаци попут тежине или висине, што може бити било која вредност у опсегу могућих тежина и висина, а не фиксне вредности или проценат класе која воли сладолед (било која вредност у опсегу 0-100%). Свака тачка података је засебан и засебан број и не спада у групу. На пример, старост ће бити укључена ако је мерите врло прецизно у данима или делићима године, уместо у целим годинама.

  • Дискретни подаци су дефинисани као они који имају дефинисан број могућих вредности између било које две вредности

    Дискретни подаци стога укључују број жалби купаца или број људи који воле сладолед, тј. Не можете имати пола жалбе или трећину особе. Други пример би била старост током целих година. За потребе анализе, дискретни подаци се сматрају врло сличним континуираним подацима.

  • Подаци рангирани су сортирани и поредани, а затим нумерисани према редоследу рангирања

    На пример, ако имате четири бита података са вредностима 4, 6, 3 и 7, можете их рангирати у растућем редоследу као 3, 4, 6 и 7. Они би тада узели редослед рангирања, тако да би 3 било 1 (1.), 4. би било 2 (2.) итд. Подаци се углавном рангирају када вас занима само редослед, а не апсолутне вредности. То је обично случај када се две променљиве мењају заједно, али немају праволинијски однос (односно мењају се различитим брзинама). На пример, графикон у наставку приказује ову врсту односа (у овом случају експоненцијалне).

    Графикон који приказује експоненцијални однос између две променљиве.

    Упозорење!


    Важно је запамтити да када рангирате податке, губите информације.

    То би, дакле, требало да се уради само када заиста треба да то учините.


Ове четири врсте података су погодне за различите врсте анализа - и за сваку ћете морати да користите различите статистичке тестове и облике анализе.

Да бисте сазнали више о коришћењу различитих врста података за анализу, можда бисте желели да погледате нашу страницу на Корелације .

Закључак

Постоји много различитих врста података које можете прикупити у оквиру свог истраживања. Избор типа података обично се заснива на вашим истраживачким методама, а оне су, пак, засноване на вашем истраживачком питању и вашем општем приступу истраживању. Међутим, избор типа података такође има импликације на врсту анализе и закључке које можете извући.


Настави до:
Разумевање корелација
Једноставна статистичка анализа