Statistische studie van relaties in de statistiek. Statistische studie van relaties tussen verschijnselen. Het concept van functionele en correlatieverbinding

2. Methoden voor het identificeren van correlaties

3. Univariate correlatie-regressieanalyse

4. Multivariate correlatie- en regressieanalyse

5. Niet-parametrische verbindingsmetingen

1. Soorten relaties en het concept van correlatieafhankelijkheid

Alle statistische indicatoren zijn met elkaar verbonden in bepaalde verbindingen en relaties.

De taak van statistisch onderzoek is om de aard van deze relatie vast te stellen.

De volgende soorten relaties bestaan:

1. Factorieel. In dit geval komen verbindingen tot uiting in een gecoördineerde variatie van verschillende kenmerken in dezelfde populatie. In dit geval fungeert een van de tekens als een factor en het andere als gevolg. De studie van deze verbindingen wordt uitgevoerd door de methode van groeperingen, evenals door de correlatietheorie .

2. Onderdeel. Dit type omvat dergelijke relaties waarin een verandering in een complex fenomeen volledig wordt bepaald door een verandering in de componenten die in dit complexe fenomeen zijn opgenomen als factoren (X = x f). Hiervoor wordt de indexmethode gebruikt.

Met behulp van een systeem van onderling verbonden indices leren ze bijvoorbeeld hoe de handelsomzet is veranderd als gevolg van veranderingen in het aantal verkochte goederen en de prijzen.

3. Balans. Ze worden gebruikt om verbanden en verhoudingen in de vorming van hulpbronnen en hun distributie te analyseren. De balans vertegenwoordigt een systeem van indicatoren, dat bestaat uit twee sommen absolute waarden, onderling verbonden door een gelijkteken,

a + b = c + d.

Het saldo van materiële hulpbronnen:

saldo + ontvangst = uitgave + saldo

initiële einde

Tekenen (indicatoren) bij het bestuderen van relaties zijn onderverdeeld in 2 typen:

Tekens die veranderingen bij anderen veroorzaken, worden genoemd faculteit, of gewoon factoren.

Tekens, veranderend onder invloed van factorkenmerken, zijn effectief.

Er zijn 2 soorten relaties: functioneel En stochastisch.

Functioneel is een relatie waarin slechts één waarde van het resulterende kenmerk overeenkomt met een bepaalde waarde van een factorkenmerk.

Als een causale afhankelijkheid niet in alle gevallen voorkomt, maar in het algemeen gemiddeld bij een groot aantal waarnemingen, dan wordt zo’n verband genoemd. stochastisch.

Een speciaal geval van stochastische koppeling is correlatie verband, waarin de verandering in de gemiddelde waarde van het resulterende kenmerk het gevolg is van een verandering in het factorkenmerk.

Kenmerken van stochastische (correlatie)verbindingen:

Ze worden niet in geïsoleerde gevallen aangetroffen, maar in het algemeen en gemiddeld met een groot aantal waarnemingen;

- onvolledig, ze houden geen rekening met alle bestaande factoren, maar alleen met de essentiële;

Onomkeerbaar. Een functionele relatie kan bijvoorbeeld worden omgezet in

nog een functionele verbinding. Als we dat zeggen productiviteit

landbouwproducten afhankelijk zijn van de hoeveelheid toegepaste kunstmest, dan heeft de tegenovergestelde bewering geen zin.

Richting markeer de verbinding direct En achteruit. Bij directe communicatie Naarmate het factorattribuut toeneemt, neemt het resulterende attribuut toe. Wanneer feedback Naarmate het factorattribuut toeneemt, neemt het resulterende attribuut af.

Door analytische expressie verbindingen benadrukken lineair (rechte lijn) En niet-lineair (kromlijnig). Als het verband tussen verschijnselen wordt uitgedrukt door de vergelijking van een rechte lijn, dan is dat zo lineair. Als de relatie wordt uitgedrukt door de vergelijking van een gebogen lijn (parabool, hyperbool, macht, exponentieel, enz.), dan niet-lineair.

Op basis van aantal factoren, handelend op het resulterende teken, zijn er verbindingen enkele factor En multifactorieel. Als één teken een factor en een effectief teken is, dan is de relatie één factor (gepaarde regressie). Als er 2 of meer factoren zijn, is de relatie multifactorieel (meervoudige regressie).

Verbindingen worden ook onderscheiden naar graad strakheid van de communicatie(zie Chaddock-tabel).

8.1. Basisconcepten van correlatie- en regressieanalyse

Bij het bestuderen van de natuur, de samenleving en de economie is het noodzakelijk rekening te houden met de onderlinge relatie van waargenomen processen en verschijnselen. In dit geval wordt de volledigheid van de beschrijving op de een of andere manier bepaald door de kwantitatieve kenmerken van de oorzaak-gevolgrelaties daartussen. Het beoordelen van de belangrijkste daarvan, evenals de impact van sommige factoren op andere, is een van de belangrijkste taken van de statistiek.

De vormen van manifestatie van relaties zijn zeer divers. Als de twee meest voorkomende soorten hoogtepunt functioneel(vol) en correlatie(onvolledige) verbinding. In het eerste geval komt de waarde van de factorkarakteristiek strikt overeen met een of meer functiewaarden. Heel vaak komen functionele verbindingen voor in de natuur- en scheikunde. In de economie is een voorbeeld de direct proportionele relatie tussen arbeidsproductiviteit en toegenomen productie.

Een correlatierelatie (die ook onvolledig of statistisch wordt genoemd) verschijnt gemiddeld voor massawaarnemingen wanneer de gegeven waarden van de afhankelijke variabele overeenkomen met een bepaald aantal waarschijnlijke waarden van de onafhankelijke variabele. De verklaring hiervoor is de complexiteit van de relaties tussen de geanalyseerde factoren, waarvan de interactie wordt beïnvloed door niet-verantwoorde willekeurige variabelen. Daarom blijkt het verband tussen de tekens slechts gemiddeld, in de meeste gevallen. In een correlatierelatie komt elke argumentwaarde overeen met functiewaarden die willekeurig in een bepaald interval zijn verdeeld.

Een kleine toename van het argument zal bijvoorbeeld slechts een gemiddelde toename of afname (afhankelijk van de richting) van de functie met zich meebrengen, terwijl specifieke waarden voor individuele observatie-eenheden zullen verschillen van het gemiddelde. Dergelijke afhankelijkheden zijn overal te vinden. In de landbouw kan dit bijvoorbeeld de relatie zijn tussen de opbrengst en de hoeveelheid toegepaste kunstmest. Uiteraard zijn deze laatste betrokken bij de vorming van het gewas. Maar voor elk specifiek veld of perceel zal dezelfde hoeveelheid toegepaste mest een andere opbrengstverhoging veroorzaken, omdat een aantal andere factoren op elkaar inwerken (weer, bodemgesteldheid, etc.) die het eindresultaat vormen. Gemiddeld wordt echter een dergelijke relatie waargenomen: een toename van de hoeveelheid toegepaste meststoffen leidt tot een toename van de opbrengst.

Volgens de communicatierichting zijn er direct, wanneer de afhankelijke variabele toeneemt met een toenemend factorattribuut, en achteruit, waarbij de groei van laatstgenoemde gepaard gaat met een afname van de functie. Dergelijke verbindingen kunnen ook respectievelijk positief en negatief worden genoemd.

Wat hun analytische vorm betreft, zijn er verbindingen lineair En niet-lineair. In het eerste geval verschijnen er gemiddeld lineaire relaties tussen de kenmerken. Een niet-lineaire relatie wordt uitgedrukt door een niet-lineaire functie, en de variabelen zijn gemiddeld niet-lineair aan elkaar gerelateerd.

Er is nog een heel belangrijk kenmerk van verbindingen vanuit het oogpunt van op elkaar inwerkende factoren. Als het verband tussen twee kenmerken wordt gekarakteriseerd, wordt dit meestal genoemd stoombad. Als er meer dan twee variabelen worden bestudeerd − meerdere.

De bovenstaande classificatiecriteria worden het vaakst aangetroffen in statistische analyses. Maar naast de genoemde zijn er ook direct indirect En vals communicatie. Eigenlijk blijkt de essentie van elk van hen uit de naam. In het eerste geval werken de factoren rechtstreeks met elkaar samen. Een indirect verband wordt gekenmerkt door de deelname van een derde variabele die de relatie tussen de onderzochte kenmerken bemiddelt. Een vals verband is een verband dat formeel tot stand is gebracht en in de regel alleen door kwantitatieve schattingen wordt bevestigd. Het heeft geen kwalitatieve basis of is zinloos.

Varieer in sterkte zwak En sterk communicatie. Dit formele kenmerk wordt uitgedrukt in specifieke hoeveelheden en geïnterpreteerd in overeenstemming met algemeen aanvaarde criteria voor de sterkte van verbinding voor specifieke indicatoren.

In de meest algemene vorm is de taak van statistieken op het gebied van het bestuderen van relaties het kwantificeren van hun aanwezigheid en richting, en het karakteriseren van de sterkte en vorm van invloed van sommige factoren op andere. Om dit op te lossen, worden twee groepen methoden gebruikt, waarvan er één methoden voor correlatieanalyse omvat, en de andere - regressieanalyse. Tegelijkertijd combineren een aantal onderzoekers deze methoden tot een correlatie-regressieanalyse, die een bepaalde basis heeft: de aanwezigheid van een aantal algemene computerprocedures, complementariteit bij de interpretatie van resultaten, enz.

Daarom kunnen we in deze context spreken over correlatieanalyse in brede zin - wanneer de relatie uitgebreid wordt gekarakteriseerd. Tegelijkertijd is er sprake van een correlatieanalyse in enge zin – waarbij de sterkte van het verband wordt onderzocht – en een regressieanalyse, waarbij de vorm ervan en de impact van sommige factoren op andere worden beoordeeld.

De taken zelf correlatie analyse worden gereduceerd tot het meten van de nauwheid van het verband tussen verschillende kenmerken, het vaststellen van onbekende causale relaties en het beoordelen van de factoren die de grootste invloed hebben op het resulterende kenmerk.

Taken regressie analyse liggen op het gebied van het vaststellen van de vorm van de afhankelijkheid, het bepalen van de regressiefunctie en het gebruiken van een vergelijking om de onbekende waarden van de afhankelijke variabele te schatten.

De oplossing voor deze problemen is gebaseerd op geschikte technieken, algoritmen en indicatoren, waarvan het gebruik aanleiding geeft om te praten over de statistische studie van relaties.

Opgemerkt moet worden dat traditionele methoden voor correlatie en regressie breed vertegenwoordigd zijn in verschillende statistische softwarepakketten voor computers. De onderzoeker kan alleen de informatie correct voorbereiden, een softwarepakket selecteren dat aan de analysevereisten voldoet en klaar zijn om de verkregen resultaten te interpreteren. Er zijn veel algoritmen voor het berekenen van communicatieparameters, en op dit moment is het nauwelijks aan te raden om zo'n complex type analyse handmatig uit te voeren. Computationele procedures zijn van onafhankelijk belang, maar kennis van de principes van het bestuderen van relaties, mogelijkheden en beperkingen van bepaalde methoden voor het interpreteren van resultaten is een voorwaarde voor onderzoek.

Methoden voor het beoordelen van de sterkte van een verbinding zijn onderverdeeld in correlatie (parametrisch) en niet-parametrisch. Parametrische methoden zijn gebaseerd op het gebruik, in de regel, van schattingen van de normale verdeling en worden gebruikt in gevallen waarin de bestudeerde populatie bestaat uit waarden die voldoen aan de wet van de normale verdeling. In de praktijk wordt dit standpunt meestal a priori aanvaard. Eigenlijk zijn deze methoden parametrisch en worden ze gewoonlijk correlatiemethoden genoemd.

Niet-parametrische methoden leggen geen beperkingen op aan de verdelingswet van de bestudeerde grootheden. Hun voordeel is de eenvoud van berekeningen.

8.2. Paarsgewijze correlatie en paarsgewijze lineaire regressie

De eenvoudigste manier om een verband tussen twee kenmerken te identificeren, is door te construeren correlatietabel:

\Y \ X\	J 1	J2	...	Y z	Totaal	Y ik
X 1	f 11	12	...	f 1z
X 1	f 21	22	...	f 2z
...	...	...	...	...	...	...
Xr	f k1	k2	...	f kz
Totaal			...		N
			...			-

De groepering is gebaseerd op twee kenmerken die in de relatie zijn bestudeerd: X en Y. De frequenties f ij tonen het aantal overeenkomstige combinaties van X en Y. Als f ij willekeurig in de tabel zijn geplaatst, kunnen we praten over de afwezigheid van een relatie tussen de variabelen. In het geval van de vorming van een karakteristieke combinatie f ij is het toegestaan om een verband tussen X en Y te beweren. Bovendien, als f ij geconcentreerd is nabij een van de twee diagonalen, vindt er een directe of omgekeerde lineaire verbinding plaats.

Een visuele weergave van de correlatietabel is correlatie veld. Het is een grafiek waarin X-waarden op de abscis-as zijn uitgezet, Y-waarden op de ordinaat-as en de combinatie van X en Y wordt weergegeven met stippen door de locatie van de stippen en hun concentraties in a bepaalde richting kan men de aanwezigheid van een verbinding beoordelen.

In de resultaten van de correlatietabel worden twee verdelingen gegeven in rijen en kolommen: één voor X, de andere voor Y. Laten we voor elke X i de gemiddelde waarde van Y berekenen, d.w.z. , Hoe

De reeks punten (X i, ) geeft een grafiek die de afhankelijkheid illustreert van de gemiddelde waarde van het effectieve attribuut Y van de factor X, – empirische regressielijn, duidelijk laten zien hoe Y verandert als X verandert.

In wezen karakteriseren zowel de correlatietabel, het correlatieveld als de empirische regressielijn de relatie al voorlopig wanneer de factor en de resulterende kenmerken worden geselecteerd en het noodzakelijk is om aannames te formuleren over de vorm en richting van de relatie. Tegelijkertijd vereist de kwantitatieve beoordeling van de dichtheid van de verbinding aanvullende berekeningen.

In de praktijk worden lineaire methoden veel gebruikt om de dichtheid van een verbinding te kwantificeren. correlatiecoëfficiënt. Soms wordt dit eenvoudigweg de correlatiecoëfficiënt genoemd. Als de waarden van de variabelen X en Y worden gegeven, wordt deze berekend met behulp van de formule

U kunt andere formules gebruiken, maar het resultaat moet voor alle berekeningsopties hetzelfde zijn.

De correlatiecoëfficiënt heeft waarden in het bereik van -1 tot + 1. Algemeen wordt aangenomen dat als |r| < 0,30, то связь слабая; при |r| = (0,3 ÷ 0,7) – gemiddeld; bij |r| > 0,70 – sterk of strak. Wanneer |r| = 1 – functionele verbinding. Als r een waarde van ongeveer 0 aanneemt, geeft dit aanleiding om te spreken van de afwezigheid van een lineair verband tussen Y en X. In dit geval is echter niet-lineaire interactie mogelijk. waarvoor aanvullende verificatie van andere hieronder besproken meters vereist is.

Regressieanalysemethoden worden gebruikt om de impact van veranderingen in X op variaties in Y te karakteriseren. In het geval van een gepaarde lineaire relatie wordt een regressiemodel gebouwd

waar n – aantal waarnemingen;
a 0 en 1 zijn onbekende parameters van de vergelijking;
e i is de fout van de willekeurige variabele Y.

De regressievergelijking wordt geschreven als

waarbij Y iteor de berekende vereffende waarde is van het resulterende kenmerk na substitutie in vergelijking X.

Parameters a 0 en a 1 worden geschat met behulp van procedures, waarvan de meest gebruikte is kleinste kwadratenmethode. De essentie ervan ligt in het feit dat de beste schattingen wanneer worden verkregen

die. de som van de kwadratische afwijkingen van de empirische waarden van de afhankelijke variabele ten opzichte van de waarden berekend met behulp van de regressievergelijking moet minimaal zijn. De som van de gekwadrateerde afwijkingen is een functie van de parameters a 0 en a 1. De minimalisatie ervan wordt uitgevoerd door het systeem van vergelijkingen op te lossen

U kunt ook andere formules gebruiken die voortkomen uit de kleinste kwadratenmethode, bijvoorbeeld:

Het lineaire regressieapparaat is vrij goed ontwikkeld en is in de regel beschikbaar in een reeks standaard correlatiebeoordelingsprogramma's voor computers. De betekenis van de parameters is belangrijk: en 1 is een regressiecoëfficiënt die het effect karakteriseert dat een verandering in X heeft op Y. Het laat zien hoeveel eenheden Y gemiddeld zal veranderen als X met één eenheid verandert. Als a groter is dan 0, wordt er een positief verband waargenomen. Als a een negatieve waarde heeft, betekent een toename van X met één een afname van Y gemiddeld met a 1. De parameter a 1 heeft de dimensie van de verhouding Y tot X.

De parameter a 0 is een constante in de regressievergelijking. Naar onze mening heeft het geen economische betekenis, maar wordt het in een aantal gevallen geïnterpreteerd als de beginwaarde van U.

Op basis van gegevens over de kosten van apparatuur X en arbeidsproductiviteit Y werd de vergelijking bijvoorbeeld verkregen met behulp van de kleinste kwadratenmethode

Y = -12,14 + 2,08X.

Coëfficiënt a betekent dat de kosten van apparatuur met 1 miljoen roebel stijgen. leidt gemiddeld tot een stijging van de arbeidsproductiviteit met 2,08 duizend roebel.

De waarde van de functie Y = a 0 + a 1 X wordt de berekende waarde genoemd en wordt weergegeven in de grafiek theoretische regressielijn.

De betekenis van theoretische regressie is dat het een schatting is van de gemiddelde waarde van de variabele Y voor een gegeven waarde van X.

Gepaarde correlatie of gepaarde regressie kan worden beschouwd als een speciaal geval van het weerspiegelen van de relatie tussen een afhankelijke variabele enerzijds en een van de vele onafhankelijke variabelen anderzijds. Wanneer het nodig is om de relatie van de gehele gespecificeerde reeks onafhankelijke variabelen met het resulterende kenmerk te karakteriseren, spreken we van meerdere correlatie of meervoudige regressie.

8.3. Het beoordelen van de betekenis van relatieparameters

Nadat correlatie- en regressieschattingen zijn verkregen, is het noodzakelijk om deze te controleren op overeenstemming met de werkelijke parameters van de relatie.

Bestaande computerprogramma's bevatten meestal enkele van de meest voorkomende criteria. Om de significantie van de paarsgewijze correlatiecoëfficiënt te beoordelen, wordt de standaardfout van de correlatiecoëfficiënt berekend:

Als eerste benadering is het noodzakelijk dat . De betekenis van r xy wordt gecontroleerd door het te vergelijken met , en we krijgen

waarbij t berekend de zogenaamde berekende waarde van het t-criterium is.

Als de berekende t groter is dan de theoretische (tabelvormige) waarde van de Student-test (t tab) voor een bepaald waarschijnlijkheidsniveau en (n-2) vrijheidsgraden, dan kan worden beargumenteerd dat r xy significant is.

Op dezelfde manier worden op basis van de overeenkomstige formules de standaardfouten van de parameters van de regressievergelijking berekend, en vervolgens de t-tests voor elke parameter. Het is opnieuw belangrijk om te controleren of aan de voorwaarde t berekend > t tabel is voldaan. Anders is er geen reden om de verkregen parameterschatting te vertrouwen.

De conclusie over de juistheid van de keuze van het type relatie en de kenmerken van de betekenis van de gehele regressievergelijking wordt verkregen met behulp van het F-criterium, waarbij de berekende waarde wordt berekend:

waarbij n het aantal waarnemingen is;
m is het aantal parameters van de regressievergelijking.

De berekende F moet ook groter zijn dan de theoretische F bij v 1 = (m-1) en v 2 = (n-m) vrijheidsgraden. Anders moet u de vorm van de vergelijking, de lijst met variabelen, enz. heroverwegen.

8.4. Niet-parametrische methoden voor het schatten van relaties

De methoden voor correlatie- en variantieanalyse zijn niet universeel: ze kunnen worden gebruikt als alle onderzochte kenmerken kwantitatief zijn. Bij het gebruik van deze methoden is het onmogelijk om te doen zonder de belangrijkste parameters van de verdeling (gemiddelde waarden, varianties) te berekenen, daarom worden ze genoemd parametrische methoden.

Ondertussen heeft men in de statistische praktijk te maken met problemen bij het meten van de relatie tussen kwalitatieve kenmerken, waarop parametrische analysemethoden in hun gebruikelijke vorm niet toepasbaar zijn. De statistische wetenschap heeft methoden ontwikkeld die kunnen worden gebruikt om de relatie tussen verschijnselen te meten zonder gebruik te maken van kwantitatieve waarden van het attribuut, en dus distributieparameters. Dergelijke methoden worden genoemd niet parametrisch.

Als de relatie tussen twee kwalitatieve kenmerken wordt bestudeerd, wordt gebruik gemaakt van de combinatorische verdeling van bevolkingseenheden in de vorm van de zogenaamde tabellen van wederzijdse contingentie.

Laten we eens kijken naar de methodologie voor het analyseren van tabellen van wederzijdse contingentie, waarbij we een specifiek voorbeeld gebruiken van sociale mobiliteit als een proces om het isolement van individuele sociale en professionele groepen van de bevolking te overwinnen. Hieronder vindt u gegevens over de verdeling van afgestudeerden van de middelbare school naar werkgebied, waarbij vergelijkbare sociale groepen van hun ouders worden benadrukt.

De verdeling van de frequenties over de rijen en kolommen van de kruistabel stelt ons in staat de belangrijkste patronen van sociale mobiliteit te identificeren: 42,9% van de kinderen van ouders in groep 1 (“Industrie en bouw”) is werkzaam op het gebied van intellectuele arbeid (39 van 91); 38,9% van de kinderen. waarvan de ouders in de landbouw werken, in de industrie werken (34 van de 88), enz.

Ook bij de overdracht van beroepen kan men duidelijke erfelijkheid opmerken. Van degenen die in de landbouw kwamen, zijn dus 29 mensen, oftewel 64,4%, kinderen van landarbeiders; meer dan 50% op het gebied van intellectueel werk heeft ouders die tot dezelfde sociale groep behoren, enz.

Het is echter belangrijk om een algemene indicator te verkrijgen die de nauwheid van het verband tussen kenmerken karakteriseert en waarmee men de manifestatie van het verband in verschillende populaties kan vergelijken. Hiervoor berekenen ze bijv. wederzijdse contingentiecoëfficiënten Pearson (S) en Tsjoeprov (C):

waarbij f 2 de gemiddelde vierkante conjugatie-indicator is, bepaald door één af te trekken van de som van de verhoudingen van de kwadratische frequenties van elke cel van de correlatietabel tot het product van de frequenties van de overeenkomstige kolom en rij:

K 1 en K 2 – het aantal groepen voor elk van de kenmerken. De waarde van de coëfficiënt van wederzijdse contingentie, die de nauwe samenhang tussen kwalitatieve kenmerken weerspiegelt, schommelt binnen het gebruikelijke bereik voor deze indicatoren van 0 tot 1.

In sociaal-economisch onderzoek komen vaak situaties voor waarin een kenmerk niet kwantitatief wordt uitgedrukt, maar de eenheden van de populatie kunnen worden geordend. Deze ordening van populatie-eenheden op attribuutwaarde wordt genoemd rangschikking. Voorbeelden hiervan zijn het rangschikken van studenten (leerlingen) op basis van hun vaardigheden, en elke groep mensen op basis van opleidingsniveau, beroep, vermogen om creatief te zijn, enz.

Bij het rangschikken wordt elke eenheid in de populatie toegewezen rang, die. serienummer. Als de waarde van een kenmerk voor verschillende eenheden hetzelfde is, krijgen ze een gecombineerd gemiddeld rangnummer. Als de 5e en 6e populatie-eenheid bijvoorbeeld dezelfde kenmerkwaarden hebben, krijgen beide een rang gelijk aan (5 + 6) / 2 = 5,5.

Het meten van de relatie tussen gerangschikte kenmerken gebeurt met behulp van rangschik correlatiecoëfficiënten Spearman (r) en Kendall (t). Deze methoden zijn niet alleen toepasbaar voor kwalitatieve, maar ook voor kwantitatieve indicatoren, vooral bij een kleine populatieomvang, aangezien niet-parametrische rangcorrelatiemethoden geen beperkingen met betrekking tot de aard van de verdeling van het kenmerk met zich meebrengen.

Vorig

De studie van objectief bestaande verbanden tussen sociaal-economische verschijnselen en processen is de belangrijkste taak van de statistiektheorie. Bezig

Statistisch onderzoek naar afhankelijkheden brengt oorzaak-en-gevolg relaties tussen verschijnselen aan het licht, waardoor het mogelijk wordt factoren (tekens) te identificeren die een grote invloed hebben op de variatie van de onderzochte verschijnselen en processen. Oorzaak-en-gevolgrelaties zijn zo'n verband tussen verschijnselen en processen wanneer een verandering in een van hen – de oorzaak – leidt tot een verandering in de andere – het gevolg.

Financiële en economische processen zijn het resultaat van de gelijktijdige invloed van een groot aantal oorzaken. Bijgevolg is het bij het bestuderen van deze processen noodzakelijk om de belangrijkste oorzaken te identificeren, los te zien van de secundaire.

De eerste fase van de statistische studie van communicatie is gebaseerd op kwalitatieve analyse geassocieerd met de analyse van de aard van een sociaal of economisch fenomeen met behulp van de methoden van de economische theorie, sociologie en concrete economie. De tweede fase, het bouwen van een communicatiemodel, is gebaseerd op statistische methoden: groeperingen, gemiddelde waarden, enzovoort. De derde en laatste fase, de interpretatie van de resultaten, houdt opnieuw verband met de kwalitatieve kenmerken van het fenomeen dat wordt bestudeerd. De statistiek heeft veel methoden ontwikkeld om relaties te bestuderen. De keuze van de methode voor het bestuderen van communicatie hangt af van het cognitieve doel en de doelstellingen van het onderzoek.

Tekens zijn, afhankelijk van hun essentie en betekenis voor het bestuderen van de relatie, verdeeld in twee klassen. Tekens die veranderingen in andere bijbehorende tekens veroorzaken, worden genoemd faculteit, of gewoon factoren. Kenmerken die veranderen onder invloed van factorkenmerken worden genoemd effectief.

In de statistiek wordt onderscheid gemaakt tussen functionele en stochastische afhankelijkheden. Functioneel is een relatie waarin een bepaalde waarde van een factorkenmerk overeenkomt met slechts één waarde van het resulterende kenmerk.

Als een causale afhankelijkheid niet in elk individueel geval voorkomt, maar in het algemeen gemiddeld bij een groot aantal waarnemingen, dan wordt zo’n afhankelijkheid genoemd. stochastisch. Een speciaal geval van stochastische koppeling is correlatie een relatie waarin een verandering in de gemiddelde waarde van een resulterend kenmerk het gevolg is van een verandering in factorkenmerken.

Verbindingen tussen verschijnselen en hun kenmerken worden geclassificeerd op basis van de mate van nabijheid,

richting en analytische expressie.

Afhankelijk van de mate van nabijheid van de verbinding, worden ze onderscheiden:

Met een toename of afname van de waarden van het factorkenmerk is er een toename of afname van de waarden van het resulterende kenmerk. Een toename van de productievolumes draagt dus bij aan een toename van de winst van de onderneming. Wanneer achteruit verbindingen, de waarden van de resulterende karakteristiek veranderen onder invloed van de factorkarakteristiek, maar in de tegenovergestelde richting vergeleken met de verandering in de factorkarakteristiek, dat wil zeggen achteruit– dit is een relatie waarbij, bij een stijging of daling van de waarden van het ene kenmerk, er een daling of stijging is van de waarden van een ander kenmerk. Een verlaging van de kosten per productie-eenheid brengt dus een verhoging van de winstgevendheid met zich mee.

Volgens de analytische uitdrukking worden verbindingen onderscheiden direct(of gewoon of-

nee) En niet-lineair. Als een statistische relatie tussen verschijnselen kan worden toegepast

wordt bij benadering uitgedrukt door de vergelijking van een rechte lijn, deze wordt genoemd lineair soort verbinding.

Stuur uw goede werk naar de kennisbank is eenvoudig. Gebruik onderstaand formulier

Studenten, promovendi en jonge wetenschappers die de kennisbasis gebruiken in hun studie en werk zullen je zeer dankbaar zijn.

Geplaatst op http://www.allbest.ru/

Lezing

Onderwerp: Statistisch onderzoek naar de relatie tussen indicatoren

1. Methoden voor correlatie- en regressieanalyse van de relatie tussen indicatoren voor commerciële activiteit

De studie van relaties op de markt voor goederen en diensten is de belangrijkste functie van economische werknemers. Het is belangrijk dat het bestuderen van de relatie tussen indicatoren van commerciële activiteit niet alleen nodig is om het bestaan van een verband vast te stellen. Om de voorspelling en het rationele beheer van het mechanisme van marktrelaties wetenschappelijk te onderbouwen, is het belangrijk om wiskundige zekerheid te geven aan de geïdentificeerde verbanden. Zonder een kwantitatieve beoordeling van het communicatiepatroon is het onmogelijk de resultaten van economische ontwikkelingen op een zodanig niveau te brengen dat ze voor praktische doeleinden kunnen worden gebruikt.

Statistische indicatoren van commerciële activiteit, die de objectieve onderlinge afhankelijkheid van individuele aspecten van commerciële activiteit weerspiegelen, kunnen bestaan uit de volgende hoofdtypen communicatie:

De balansrelatie tussen indicatoren voor commerciële activiteit karakteriseert de relatie tussen de bronnen van fondsen en het gebruik ervan. Het wordt bijvoorbeeld uitgedrukt in de grondstoffenbalansformule:

Hij + P = V + Oké

De linkerkant van de formule karakteriseert het aanbod, en de rechterkant karakteriseert het gebruik van grondstoffen. De belangrijke praktische betekenis van de grondstoffenbalansformule is dat bij gebrek aan kwantitatieve boekhouding voor de verkoop van goederen, op basis daarvan het bedrag van de detailhandelsverkopen van individuele goederen wordt bepaald.

Componentrelaties van indicatoren voor commerciële activiteit worden gekenmerkt door het feit dat een verandering in een statistische indicator wordt bepaald door een verandering in de componenten die in deze indicator zijn opgenomen als vermenigvuldigers:

a = b x c

In bedrijfsstatistieken worden componentrelaties gebruikt in de indexmethode om de rol van individuele factoren in de algehele meting van een complexe indicator te identificeren.

Ipq= Ip x Iq

De praktische betekenis van indicatoren die uit een componentrelatie bestaan, is dat je hiermee de waarde van een van de onbekende componenten kunt bepalen.

Factorrelaties worden gekenmerkt door het feit dat ze zich manifesteren in een consistente variatie van de bestudeerde indicatoren. In dit geval fungeren sommige indicatoren als factorindicatoren, terwijl andere als resultaatindicatoren fungeren. Factorverbindingen kunnen op hun beurt als functioneel en correlatief worden beschouwd. Bij een functionele verbinding wordt de verandering in het resulterende kenmerk (y) volledig bepaald door de werking van de factorkenmerk (x):

In een correlatierelatie is de verandering in het resulterende kenmerk (y) niet geheel, maar slechts gedeeltelijk te wijten aan de invloed van de factorkenmerk (x), aangezien de invloed van andere factoren (e) mogelijk is:

Door hun aard zijn correlatieverbindingen relatieve verbindingen. Hier zijn, met dezelfde in aanmerking genomen waarde van het factorkenmerk, verschillende waarden van het resulterende kenmerk mogelijk. Dit komt door de aanwezigheid van andere factoren die verschillend kunnen zijn qua samenstelling, richting en kracht van de werking op individuele eenheden van de statistische populatie. Voor de statistische populatie die als geheel wordt bestudeerd, wordt hier dus een relatie gelegd waarin een bepaalde verandering in het factorkenmerk overeenkomt met de gemiddelde verandering in het resulterende kenmerk. Een kenmerkend kenmerk van correlaties is dan ook dat ze niet in geïsoleerde gevallen voorkomen, maar in grote aantallen. Bij het statistisch onderzoek naar correlaties wordt de invloed van de factorkenmerken waarmee rekening wordt gehouden, bepaald, waarbij wordt geabstraheerd van andere argumenten. Bij het bestuderen van correlaties worden de volgende taken gesteld:

het controleren van de bepalingen uit de economische theorie over de mogelijkheid van een verband tussen de bestudeerde indicatoren en het geven van een analytische vorm van afhankelijkheid aan het geïdentificeerde verband;

het vaststellen van kwantitatieve schattingen van de nauwheid van het verband, waarbij de sterkte van de invloed van factorkenmerken op de resultaten wordt gekarakteriseerd.

Als de relatie tussen twee kenmerken wordt bestudeerd, is er sprake van een paarsgewijze correlatie. Als de relatie tussen veel kenmerken wordt bestudeerd, is de correlatie meervoudig.

2. Constructie van vergelijkingen van gesimuleerde functies

De meest ontwikkelde methodologie in de statistische theorie is de zogenaamde paarcorrelatiemethodologie. Bij het bestuderen van de relatie tussen indicatoren worden verschillende soorten lineaire en kromlijnige relatievergelijkingen gebruikt:

lineair -

parabolisch -

hyperbolisch -

Het bepalen van de parameters van de regressievergelijking begint met het leggen van het verband tussen de beschouwde indicatoren. Om dit te doen, wordt de paarcorrelatiecoëfficiënt berekend:

Om conclusies te trekken over de praktische betekenis van de resulterende correlatiecoëfficiënt, wordt een kwalitatieve beoordeling gegeven op basis van de Chaddock-schaal:

Met waarden van de nabijheid van verbindingsindices groter dan 0,7, is de afhankelijkheid van het resulterende kenmerk van de faculteit hoog, aangezien de waarde van de determinatiecoëfficiënt altijd meer dan 50% zal zijn.

De determinatiecoëfficiënt karakteriseert welk deel van de effectieve indicator de invloed van de onderzochte factor verklaart:

Als de correlatiecoëfficiënt tussen de effectieve indicator en de onderzochte factor groter is dan 0,7, is er dus een relatie die de verandering in de effectieve indicator ten opzichte van de factor in kwestie met meer dan 50% verklaart.

Voorbeeld: analyseer gegevens over de gemiddelde prijs voor Parmezaanse kaas in de regio Donetsk over een aantal jaren:

	Gemiddeld salaris, UAH.

Er is dus een grote afhankelijkheid van het gemiddelde maandloon van het jaar, namelijk 92% van de lonen wordt verklaard door veranderingen in het jaar.

3. Beoordeling van de geschiktheid en betrouwbaarheid van de vergelijking

correlatieregressie commercieel statistisch

De parameters van de voor modellering geselecteerde functies kunnen op verschillende manieren worden gevonden. De meest nauwkeurige methode is de kleinste kwadratenmethode. Daarop wordt voor elk van de functies een speciaal systeem van vergelijkingen gevormd:

lineair -

parabolisch -

hyperbolisch -

In elk van de systemen:

Y - effectieve indicator;

X - tijdindicator;

N - aantal waarnemingen;

A, b, c - modelparameters.

Het aftellen van de tijdindicator begint vanaf 1. Op basis van de bekende waarden van x en y worden alle bedragen bepaald en in het systeem ingevoerd. Als resultaat wordt een stelsel van vergelijkingen verkregen voor onbekende parameters. Bij het oplossen van een systeem worden specifieke digitale waarden van parameters gevonden en deze worden vervangen door de oplossing van modelleringsfuncties die in de praktijk moeten worden geëvalueerd en gebruikt.

Voorbeeld: laten we de hulptabel berekenen:

Laten we stelsels vergelijkingen maken voor drie functies en de waarden van de parameters van de vergelijkingen vinden:

lineair model: 1525 = 7a + 28b

7266 = 28a + 140b

a = -5,7 b = 53,04 y = -5,7+53,04x

parabolisch model: 1525 = 7a + 28b + 140c

7266 = 28a + 140b + 784c

40248 = 140a + 784b + 4676c

a = 697,62 b = -114,08 c = 68,59 y = 697,62 - 114,08x + 68,59x2

hyperbolisch model: 1525 = 7a + 2,59b

432,13 = 2,59a + 1,51b

a = 237,65 b = 53,49 y = 237,65 + 53,49/x

4. Schatting van vergelijkingsparameters

De geschiktheid van een economisch-wiskundig model kan worden vastgesteld met behulp van de gemiddelde benaderingsfout (gemiddeld percentage discrepantie tussen theoretische en praktische waarden):

waarbij y1 de werkelijke waarden van de prestatie-indicator zijn;

y0 - theoretische waarden gevonden uit de vergelijking.

Bij het modelleren van economische indicatoren is meestal een fout van 5% toegestaan. Het model wordt als adequaat en daarom als significant beschouwd.

De selectie van het meest optimale model kan worden uitgevoerd op basis van de resterende standaarddeviatie (residuele variantie):

waarbij l het aantal parameters van de vergelijking is.

De beste functie is degene met de kleinste resterende variantie.

De betrouwbaarheid van de vergelijking wordt beoordeeld met behulp van het Fisher-criterium, rekening houdend met de F-statistieken:

waar is de gemiddelde waarde van de effectieve indicator.

Hoe groter de berekende F-toetswaarde, hoe significanter het berekende model. De berekende waarde wordt vergeleken met de kritische waarde, die te vinden is in de Fisher-verdelingstabellen voor vrijheidsgraden (l-1) en (n-l), waarbij het significantieniveau wordt ingesteld op 0,05 (5% fout). Als de tabel F>F is, wordt de vergelijking als betrouwbaar beschouwd met een waarschijnlijkheid van 0,95. Anders wordt de vergelijking niet als betrouwbaar beschouwd.

Berekening voor lineaire functie:

			Benadering		(U0 - U0av)2

F-tabel - 230.2

voor een parabolische functie:

			Benadering		(U0 - U0av)2

F-tafel - 19.25

voor een hyperbolische functie:

			Benadering		(U0 - U0av)2

F-tabel - 230.2

Geen van de gepresenteerde functies is dus voldoende betrouwbaar en heeft geen praktische betekenis vanwege de grote discrepanties tussen de theoretische en werkelijke waarden van de effectieve indicator.

Om de economische inhoud van de parameters van de vergelijkingen te karakteriseren, is het het meest geschikt om elasticiteitscoëfficiënten te gebruiken, die karakteriseren met welk percentage de functie gemiddeld zal veranderen bij een verandering in het argument met 1% met een vaste waarde van de resterende factoren op elk niveau:

waarbij Ei de elasticiteitscoëfficiënt van de i-de factor is;

Regressieparameters van de i-de factor;

Gemiddelde waarde van de i-de factor;

Gemiddelde waarde van de effectieve indicator.

Geplaatst op Allbest.ru

...

Soortgelijke documenten

Basisconcepten van correlatie- en regressieanalyse. Berekening van indicatoren van de sterkte en nabijheid van verbindingen tussen verschijnselen en processen, de details van hun interpretatie. Evaluatie van de resultaten van lineaire regressieanalyse. Coëfficiënt van meervoudige bepaling.

test, toegevoegd op 04/02/2013

Analyse van de essentie van winst, de rol ervan in de activiteiten van de onderneming, evenals de procedure voor de berekening en analyse ervan met behulp van statistische methoden. Het concept van winstgevendheid en de statistische studie van de indicatoren ervan. Toepassing van steekproeftrekking en methode bij financiële en economische problemen.

cursuswerk, toegevoegd op 12/12/2012

Statistische studie van tijdreeksen, soorten indicatoren. Berekening van de sluitingscoëfficiënt. Ketting- en basisindicator. Gemiddeld niveau van dynamische series. Bepaling van het algemene patroon in de ontwikkeling van het fenomeen. Statistische studie van seizoensvariaties.

lezing, toegevoegd op 27-04-2013

Belangrijkste kenmerken, doelstellingen en voorwaarden voor de toepassing van de correlatie-regressiemethode. Methoden voor correlatie- en regressieanalyse. Kendall, Spearman, Fechner rangschikken correlatiecoëfficiënt. Bepalen van de nauwheid van de relatie tussen indicatoren.

test, toegevoegd op 04/08/2013

Statistisch onderzoek en methoden voor het berekenen van indicatoren van het productievolume van goederen en diensten. Analyse van de afhankelijkheid van het aantal misdaden van het aantal werklozen in de centrale regio van Rusland met behulp van een pakket applicatieprogramma's voor het verwerken van spreadsheets.

cursuswerk, toegevoegd op 19-03-2010

Statistische studie van de arbeidsproductiviteit. Analyse van structurele groeperingen. Typen en taken van groepen, verbindingen daartussen. Groeperingstechniek. Sturgess-formule. Statistieken van de kapitaal-arbeidsverhouding, arbeidsproductiviteit en vaste activa.

cursuswerk, toegevoegd op 15-01-2009

Statistisch onderzoek naar de dynamiek van indicatoren voor de verzekeringsmarkt. Constructie van een statistische reeks voor de groepering van verzekeringsorganisaties op basis van het bedrag aan contante inkomsten, berekening van de kenmerken van de distributiereeks. Berekening van de steekproeffout van het gemiddelde inkomen.

cursuswerk, toegevoegd 01/03/2010

Vormen en beloningssystemen, de mate van hun prevalentie bij de OJSC "OZSK" -onderneming. Statistische studie van de samenstelling en structuur van het loonfonds van de onderneming. Berekening en analyse van de FZP-dynamiek, bepalende factoren. Kwantitatieve beoordeling van indicatoren.

cursuswerk, toegevoegd op 11-08-2011

Correlatie- en regressieanalyse als object van statistisch onderzoek, een systeem van statistische indicatoren die dit karakteriseren. Kenmerken en principes van toepassing van de methode van correlatie-regressieanalyse. Constructie van een statistische distributiereeks.

cursuswerk, toegevoegd op 28-01-2014

Vormen en systemen van beloning en de mate van prevalentie in de onderneming. Statistische studie van de samenstelling en structuur van het loonfonds van de onderneming. Analyse en berekening van indicatoren voor de financiële loondynamiek. Kwantitatieve beoordeling van de factoren die de dynamiek ervan bepalen.

Sociale fenomenen, inclusief juridisch belangrijke fenomenen, zijn met elkaar verbonden, afhankelijk van elkaar en conditioneren elkaar. De bestaande relaties worden gerealiseerd in de vorm van causaliteit, functionele verbinding, verbinding van staten, enz. Een speciale rol in de relaties van sociale verschijnselen behoort tot causaliteit, dat wil zeggen een deeltje van universele verbinding, maar niet subjectief, maar objectief reëel. Deze objectief noodzakelijke verbinding, waarbij een of meer onderling samenhangende verschijnselen, een oorzaak (factor) genoemd, aanleiding geeft tot een ander fenomeen, een gevolg (resultaat) genoemd, en dat ook wel causaliteit.

De rechtswetenschappen specificeren dit concept in relatie tot verschijnselen en processen van juridisch significante aard. Van de juridische disciplines die het verst gevorderd zijn in de studie van causaliteit is de criminologie – de wetenschap van misdaad, de oorzaken en preventie ervan, het strafrecht, waar het vaststellen van een causaal verband tussen een handeling en een gevolg een noodzakelijke voorwaarde is voor het ontstaan van misdaad. strafrechtelijke aansprakelijkheid. Maar causaliteitskwesties zijn belangrijk in administratieve, civiele en andere rechtsgebieden.

Er bestaat niet alleen een overeenkomst tussen causaliteit in de criminologie en het recht, maar ook aanzienlijke verschillen. Het causale verband tussen criminogene factoren en het plegen van een misdrijf (oorzaken en misdaad) gaat in de tijd vooraf aan het causale verband tussen een sociaal gevaarlijke handeling (inactiviteit) en de strafrechtelijke gevolgen. Dit laatste kenmerkt zich vooral door dynamische patronen en functionele verbanden, en tussen criminogene factoren en crimineel gedrag bestaan vooral statistische patronen en correlaties.

Elke natuurlijke verbinding veronderstelt herhaalbaarheid, consistentie en orde in de verschijnselen, maar de verbindingen in kwestie manifesteren zich op verschillende manieren: functionele verbindingen - in elk afzonderlijk geval, en correlatieve verbindingen - in een grote massa verschijnselen. Er bestaat bijvoorbeeld een direct causaal functioneel verband tussen een messlag en lichamelijk letsel (tenzij de schade uiteraard gecompliceerd wordt door infectie van de wond, ongekwalificeerde medische zorg, enz.). Functionele afhankelijkheid wordt gekenmerkt door het feit dat een verandering in een bepaald kenmerk, dat een functie is, verband houdt met een verandering in een ander kenmerk. Deze relatie komt in alle eenheden van elke populatie in gelijke mate tot uiting.

Als een klap met een mes een wond aan het lichaam veroorzaakt (we abstraheren van het type mes, de kracht van de klap, de locatie, de aard van de wond en andere specifieke omstandigheden), dan maakt het niet uit aan wie deze klap wordt toegebracht , de relatie tussen hem en de wond zal zich overal manifesteren. Nadat we het eenmaal hebben geïnstalleerd, gebruiken we deze afhankelijkheid in alle vergelijkbare gevallen. Medische en forensische onderzoeken zijn gebaseerd op kennis van deze afhankelijkheid. Het is nogal arbitrair om de relatie tussen een messlag en letsel toe te schrijven aan een functioneel verband. Deze vorm van afhankelijkheid is niet identiek aan de functionele verbinding in de natuurkunde of wiskunde.

In de exacte wetenschappen worden functionele relaties meestal uitgedrukt in formules. In de formule bijvoorbeeld S = kJa 2 oppervlakte van een cirkel S(resulterend teken) is rechtevenredig met het kwadraat

zijn straal R(factorieel teken). Formule I= - ontcijferd

het is moeilijker te bepalen: de sterkte van de elektrische stroom (/) is recht evenredig met de spanning (U) en omgekeerd evenredig met weerstand (R). In dit geval wordt het resulterende kenmerk bepaald door twee factorkenmerken met tegengestelde effecten. Hoe hoger de spanning of lager de weerstand, hoe groter de stroomsterkte. De functionele dynamische koppeling wordt nauwkeurig berekend. Daarom is het zowel volledig als nauwkeurig. Het werkt in alle autonome systemen met een relatief klein aantal elementen, weinig afhankelijk van externe invloeden.

De rechtswetenschappen houden zich hoofdzakelijk bezig met sociaal-juridische verschijnselen en processen, waarbij dergelijke rigide, ondubbelzinnig volledige en nauwkeurige verbanden niet bestaan. De causaliteit van misdaad, en vooral misdaad, als een sociaal massaverschijnsel, wordt geassocieerd met een groot aantal onderling afhankelijke omstandigheden, die, met een verandering in de actie van ten minste één van hen, de aard van de hele interactie als een geheel kunnen veranderen. geheel. Het aantal omstandigheden dat het plegen van misdaden beïnvloedt, bedraagt 450 of meer.

De causale relatie tussen elke tekenfactor en tekengevolg wordt gekenmerkt door ambiguïteit: de ene of de andere tekengevolg verandert onder invloed van een complex van tekenfactoren, en elke waarde van de tekenfactor komt overeen (onder invloed van andere tekenfactoren). tekenfactoren) naar verschillende waarden van het tekeneffect. Daarom heeft het verband tussen de oorzaak (reeks oorzaken) en het gevolg (misdaad of delinquentie) meerdere waarden en heeft het een probabilistisch karakter.

De dubbelzinnigheid ligt niet alleen in het feit dat elk misdrijf (en delinquentie in het algemeen) het resultaat is van vele oorzaken, maar ook in het feit dat elke oorzaak, in wisselwerking met een of andere reeks andere oorzaken, aanleiding kan geven tot niet één, maar maar verschillende gevolgen, waaronder verschillende soorten illegaal en wettig gedrag.

De probabilistische kant van de ambiguïteit van causaliteit in de criminologie en rechtssociologie “bestaat uit het feit dat wanneer een voorwaarde wordt vervangen, zelfs om dezelfde reden, een ander resultaat wordt verkregen.” Deze vorm van causaal verband, waarbij de oorzaak het gevolg niet eenduidig, maar slechts met een zekere mate van waarschijnlijkheid bepaalt, is onvolledig en wordt een correlatierelatie genoemd. Het weerspiegelt een statistisch patroon en werkt in alle niet-autonome systemen die afhankelijk zijn van voortdurend veranderende externe omstandigheden en een zeer groot aantal elementen (factoren) hebben.

De oorzaken van misdaad zijn bijvoorbeeld ‘opgelost’ in de totale massa van positieve invloeden, ‘verdeeld’ in de structuur van iemands activiteiten en ‘uitgerekt’ gedurende zijn hele leven. Daarom kan het effect van de een of andere reden alleen in een zeer grote hoeveelheid gevallen worden gedetecteerd. Maar zelfs op het massastatistische niveau, waar de invloed van willekeurige factoren op de een of andere manier wordt geneutraliseerd door wederzijdse vernietiging, kunnen de ontdekte afhankelijkheden niet volledig en accuraat zijn, dat wil zeggen functioneel. Het effect van onverklaarde, onbekende en vaak bekende, maar moeilijk te detecteren factoren komt tot uiting in het feit dat de bestudeerde verbanden niet alleen onvolledig blijken te zijn, maar ook bij benadering.

Er wordt redelijkerwijs aangenomen dat het opvoeden van een kind zonder een of beide ouders een criminogene factor is. Betekent dit dat iedereen die in zulke omstandigheden wordt grootgebracht in de toekomst een misdaad zal begaan? Echt niet. Achter de algemene factor – opvoeding zonder ouders – kan een groot aantal andere factoren schuilgaan, criminogene en anticriminogene, die voor elk kind verschillend zijn. Maar bij het bestuderen van een grote massa mensen die door en zonder ouders zijn opgevoed, in alle landen van de wereld, wordt met regelmaat een statistische afwijking vastgesteld: mensen die zijn opgegroeid zonder een of beide ouders plegen veel vaker misdaden dan degenen die zijn opgegroeid in een gezin met twee ouders. familie.

Er is een verband tussen criminogene factoren en criminaliteit directe correlatie(met een “+” teken). Hoe hoger het niveau van alcoholisme in een samenleving, hoe hoger de misdaad en de specifieke (“dronken”) misdaad. Tussen anticriminogene factoren en criminaliteit bestaat er een omgekeerde correlatie(met een “-” teken). Hoe hoger de sociale controle in een samenleving, hoe lager het misdaadcijfer. Zowel voorwaartse als achterwaartse verbindingen kunnen lineair of kromlijnig zijn.

Rechte lijn (lineaire) verbindingen verschijnen wanneer, bij een toename van de waarden van het factorteken, er een toename (direct) of een afname (invers) is in de waarde van het gevolgteken. Wiskundig gezien wordt deze relatie uitgedrukt door een rechte lijnvergelijking (regressievergelijking):

Waar bij - teken-gevolg; a en b- overeenkomstige koppelingscoëfficiënten; x - tekenfactor.

We hebben deze formule al behandeld bij het uitlijnen van een tijdreeks langs een rechte lijn.

Kromlijnig verbindingen zijn van een andere aard. Een stijging van de waarde van een factorkenmerk heeft een ongelijke impact op de waarde van het resulterende kenmerk. In eerste instantie kan deze verbinding direct zijn, en dan omgekeerd. In de rechtswetenschap zijn dergelijke verbanden nauwelijks onderzocht, maar ze bestaan wel. Een bekend voorbeeld is het verband tussen delicten en de leeftijd van de daders. Aanvankelijk neemt de criminele activiteit van individuen recht evenredig toe met de toename van de leeftijd van de daders (tot ongeveer 30 jaar), maar naarmate de leeftijd toeneemt, neemt de criminele activiteit af. Bovendien is de bovenkant van de verdelingscurve van daders naar leeftijd verschoven van gemiddeld naar links (naar een jongere leeftijd) en is deze asymmetrisch.

Een complexer voorbeeld: met de uitbreiding van de sociale controle neemt het niveau van illegaal gedrag af, maar verdere totalisering van de controle verandert het van een anticriminogene factor in een criminogene factor. Daarom is het “aandraaien van de schroeven” in de samenleving slechts tot op zekere hoogte sociaal nuttig. Dergelijke verbindingen worden statistisch beschreven door vergelijkingen van gebogen lijnen (hyperbolen, parabolen, enz.).

Correlatie lineaire verbindingen kunnen uit één factor bestaan, wanneer het verband tussen één factorteken en één gevolgteken wordt bestudeerd (paarcorrelatie). Ze kunnen multifactorieel zijn, wanneer de invloed van veel op elkaar inwerkende tekenfactoren op een tekengevolg (meervoudige correlatie) wordt bestudeerd.

Paarsgewijze correlatie wordt al lang gebruikt in juridische statistieken, en meerdere correlatie praktisch niet gebruikt, hoewel kan worden gezegd dat multifactoriële verbanden domineren in de criminologie, tortologie en rechtssociologie. Dit is te wijten aan een aantal problemen: ongeorganiseerde boekhouding van tekenfactoren, onvoldoende wiskundige, statistische en sociologische opleiding van advocaten en andere objectieve omstandigheden.

Correlaties tussen sommige verschijnselen en andere zijn al zichtbaar in de eerste stadia van de statistische gegevensverwerking. De samenvatting en groepering van statistische indicatoren, de berekening van relatieve en gemiddelde waarden, de constructie van variërende, dynamische, parallelle reeksen maken het mogelijk om het bestaan van een relatie vast te stellen tussen de bestudeerde verschijnselen en zelfs de aard ervan (direct en omgekeerd). Als we, nadat we een variatiereeks van criminelen naar leeftijd hebben geconstrueerd, ontdekken dat de hoofdfrequenties zijn gegroepeerd in het interval van de jeugd, hebben we voldoende redenen om aan te nemen dat de jeugd de meest criminogene leeftijd is. Hoewel leeftijd (zoals we in voorgaande hoofdstukken hebben vastgesteld) niet in zijn eigen betekenis handelt, maar alleen als een geïntegreerde exponent van criminogene aandoeningen die interageren met de overeenkomstige leeftijdsgebonden veranderingen in een persoon.

Laten we ons wenden tot de toestand van dronkenschap, die in alle landen van de wereld als een criminogene factor wordt beschouwd en daarom statistisch wordt gevolgd. In Rusland werd in 1996 geregistreerd dat 39% van alle geregistreerde misdaden werd gepleegd terwijl de daders dronken waren, waaronder 77,6% van de verkrachtingen, 73,5% van de opzettelijke moorden, 69,8% van het hooliganisme, 59,7% - overvallen, 57,0% - overvallen, 37,7%. % - diefstallen en 0% - omkoping. De gegeven percentages duiden op een direct verband tussen misdaden en dronkenschap (behalve omkoping). Omdat deze cijfers bijna jaar na jaar worden herhaald, duiden ze niet alleen op het bestaan van dit verband, maar tot op zekere hoogte ook op de mate van invloed van dronkenschap op verschillende soorten handelingen. Om relaties nauwkeuriger te meten, beschikt de statistiek over een groot aantal verschillende methoden.

Zie: Kudryavtsev V.N. Causaliteit in de criminologie. M., 1968; Tsereteli TV Causaliteit in het strafrecht. M, 1963.
Zie: Model van regionale criminologische en strafrechtelijke prognose. M., 1994.
Kudryavtsev V. N. Causaliteit in de criminologie. Blz. 9.
Zie: Luneev V.V. Misdaad van de 20e eeuw. Mondiale, regionale en Russische trends. blz. 775-840.

Mogelijk bent u geïnteresseerd in de volgende materialen