التوزيع الطبيعي - مقدمة بديهية بدون رياضيات

نشرت: 2021-06-28

سأحاول إبقاء هذه المقالة خالية من المعادلات والمصطلحات اللغوية - قدر الإمكان. ومع ذلك ، فأنا بحاجة إلى امتلاك القدرات التالية على الأقل:

  • قادرة على تفسير الرسوم البيانية البسيطة.
  • معرفة المستوى الابتدائي في الاحتمال. أنت على الأقل تفهم أن هناك احتمالًا بنسبة 50٪ للرأس إذا رميت عملة معدنية.
  • حساب التفاضل والتكامل والفيزياء الكمومية (مزاح!)

لماذا التوزيع الطبيعي

طريقة بديهية لفهم شيء ما هي التحقيق في سبب الحاجة إليه. لنفعل ذلك من أجل التوزيع الطبيعي (يسمى أيضًا التوزيع الغاوسي).

قل أن لديك عادة مضحكة. كل يوم ترمي قطعة نقود 100 مرة. من "الطبيعي" أن تتوقع أنك ستصاب بالرأس 50 مرة - أو ما يقرب من 50 مرة معظم اليوم. نادرًا ما تكون هناك أيام جيدة للرأس - فقد تصل إلى حوالي 55 مرة ، ونادرًا ما تتعدى 65 مرة.

الآن ، تريد تحديد هذه "الندرة". لذلك ، تبدأ في تتبع عدد المرات التي حصلت فيها على الرأس كل يوم.

عدد الرؤوس كل يوم في السنة

فيما يلي البيانات بعد عام (365 يومًا) - الأول هو عدد الرؤوس التي حصلت عليها في اليوم الأول ، وآخرها هو عدد الرؤوس التي حصلت عليها في اليوم الأخير. لا تحتاج إلى التحقق من جميع الأرقام أدناه ، ولكن من السهل تحديد أن معظمها يبلغ حوالي 50.

56 ، 47 ، 54 ، 50 ، 57 ، 51 ، 57 ، 48 ، 54 ، 62 ، 42 ، 51 ، 37 ، 42 ، 50 ، 37 ، 59 ، 48 ، 46 ، 51 ، 61 ، 47 ، 46 ، 48 ، 63 ، 55 ، 50 ، 50 ، 43 ، 46 ، 56 ، 49 ، 50 ، 54 ، 52 ، 47 ، 51 ، 59 ، 61 ، 53 ، 44 ، 53 ، 59 ، 58 ، 54 ، 54 ، 50 ، 49 ، 51 ، 46 ، 43 ، 51 ، 49 ، 54 ، 46 ، 44 ، 41 ، 51 ، 51 ، 49 ، 64 ، 46 ، 46 ، 46 ، 52 ، 48 ، 57 ، 49 ، 42 ، 46 ، 55 ، 50 ، 52 ، 51 ، 47 ، 53 ، 50 ، 48 ، 58 ، 43 ، 60 ، 49 ، 46 ، 42 ، 53 ، 45 ، 57 ، 48 ، 52 ، 47 ، 47 ، 47 ، 42 ، 57 ، 60 ، 49 ، 48 ، 50 ، 51 ، 47 ، 48 ، 52 ، 47 ، 45 ، 51 ، 55 ، 51 ، 45 ، 46 ، 46 ، 40 ، 52 ، 57 ، 48 ، 51 ، 48 ، 44 ، 46 ، 41 ، 59 ، 60 ، 46 ، 44 ، 36 ، 48 ، 52 ، 49 ، 49 ، 49 ، 51 ، 41 ، 49 ، 51 ، 51 ، 42 ، 51 ، 45 ، 54 ، 50 ، 48 ، 49 ، 43 ، 52 ، 53 ، 52 ، 53 ، 48 ، 37 ، 53 ، 54 ، 41 ، 48 ، 52 ، 46 ، 47 ، 57 ، 50 ، 49 ، 46 ، 57 ، 67 ، 50 ، 54 ، 48 ، 50 ، 60 ، 43 ، 49 ، 57 ، 57 ، 45 ، 55 ، 57 ، 52 ، 46 ، 48 ، 49 ، 51 ، 45 ، 48 ، 44 ، 48 ، 55 ، 51 ، 59 ، 52 ، 50 ، 55 ، 51 ، 46 ، 48 ، 51 ، 46 ، 50 ، 49 ، 50 ، 47 ، 51 ، 43 ، 46 ، 48 ، 56 ، 47 ، 57 ، 44 ، 54 ، 52 ، 55 ، 46 ، 49 ، 53 ، 40 ، 54 ، 54 ، 49 ، 50 ، 53 ، 41 ، 55 ، 50 ، 42 ، 58 ، 47 ، 53 ، 55 ، 45 ، 52 ، 61 ، 50 ، 49 ، 48 ، 51 ، 50 ، 56 ، 44 ، 47 ، 45 ، 48 ، 63 ، 43 ، 52 ، 55 ، 46 ، 48 ، 52 ، 49 ، 56 ، 62 ، 57 ، 54 ، 47 ، 51 ، 52 ، 43 ، 45 ، 57 ، 51 ، 46 ، 42 ، 52 ، 57 ، 54 ، 48 ، 54 ، 51 ، 49 ، 51 ، 42 ، 52 ، 50 ، 52 ، 61 ، 61 ، 44 ، 45 ، 48 ، 49 ، 48 ، 46 ، 47 ، 57 ، 44 ، 44 ، 47 ، 52 ، 47 ، 42 ، 48 ، 51 ، 58 ، 36 ، 57 ، 53 ، 49 ، 52 ، 50 ، 52 ، 56 ، 44 ، 56 ، 46 ، 42 ، 46 ، 43 ، 56 ، 49 ، 44 ، 38 ، 46 ، 52 ، 49 ، 58 ، 51 ، 49 ، 48 ، 52 ، 57 ، 43 ، 48 ، 40 ، 52 ، 54 ، 40 ، 54 ، 45 ، 49 ، 41 ، 57 ، 50 ، 52 ، 43 ، 54 ، 49 ، 45 ، 44 ، 53 ، 49 ، 43 ، 51 ، 50 ، 56 ، 45 ، 46 ، 47 ، 41 ، 52 ، 59 ، 52 ، 50 ، 48 ، 58 ، 52 ، 51 ، 55 ، 49 ، 41 ، 38 ، 57 ، 56 ، 41 ، 54 ، 44 ، 47 ، 60 ، 44

تصور أفضل مع المدرج التكراري

دعنا نرسم مدرج تكراري من البيانات أعلاه:

رسم بياني لنتائج الرأس اليومية خلال عام
رسم بياني لنتائج الرأس اليومية خلال عام

آها! ألا تبدو بالفعل مثل الصورة التي شاهدتها على الإنترنت عندما كنت تبحث عن "التوزيع الطبيعي" على Google؟ نحن على وشك الانتهاء!

لذا ، إذا كنت لا تفهم الرسوم البيانية - لقد رسمنا هنا عدد الأيام فقط لدينا عدد معين للرأس. على سبيل المثال ، حصلنا على رأس 36 مرة في يومين محددين من السنة (تحقق من البيانات أعلاه إذا كنت لا تصدقني) ، ولهذا السبب يوجد شريط ارتفاع 2 وحدة على النقطة الأفقية عند 36 (الأحمر المستطيل على اليسار في الصورة أدناه).

الحانات على مسافة مماثلة من المركز متشابهة
الحانات على مسافة مماثلة من المركز متشابهة

ملاحظات

  1. واضح جدا ومتوقع - 50 رأسا حدثت في معظم الأوقات.
  2. كلما ابتعدنا عن المركز (50) ، يتناقص الحدوث في الغالب.
  3. تأخذ القضبان على نفس المسافة أشكالًا متشابهة. على سبيل المثال ، إذا قمت بتحريك وحدة واحدة إلى اليسار (49) أو اليمين (51) - تكون التكرارات متشابهة - 30 و 31 على التوالي (المستطيلات الخضراء). إذا قمت بتحريك 14 وحدة لليسار (36) أو لليمين (64) ، فستكون التكرارات متشابهة مرة أخرى - 2 و 1 على التوالي (مستطيلات حمراء).

بيانات 10 سنوات

الآن دعنا ننتقل سريعًا قليلاً - ونرسم بيانات 10 سنوات.

بيانات 10 سنوات

بيانات 1000 سنة

حسنًا - آخر واحد. دعونا نرسم بيانات 1000 سنة.

بيانات 1000 سنة

ملاحظات

  1. كلما جربنا أكثر ، كلما كانت الأشكال أكثر سلاسة.
  2. كلما جربنا أكثر ، كلما اتبعت الأعمدة الملاحظات أعلاه (على سبيل المثال ، تأخذ الأعمدة الموجودة على مسافة مماثلة أشكالًا أكثر قربًا).

أين التوزيع الطبيعي اللعين

حسنًا - خلفية كثيرة جدًا - دعنا الآن نصل إلى النقطة.

دعنا نرى الإجابة التي اقترحتها Google:

التوزيع الطبيعي

بعض الأشياء في هذا التعريف:

المتغير العشوائي: ببساطة - المتغير العشوائي هو مجموعة من القيم المحتملة لتجربة عشوائية مثل رمي العملة. في مثالنا ، القيمة المحتملة لتجربتنا هي الرأس أو الذيل .

على شكل جرس: هل لاحظت أن المدرج التكراري لدينا يأخذ شكل الجرس؟

شكل الجرس

متماثل: القضبان على نفس المسافة لها أشكال متشابهة - أليست متناظرة؟

لذلك ، يمثل التوزيع الطبيعي توزيع النتائج لأحداث مثل رمي العملة - حيث يميل التوزيع إلى الحفاظ على بعض الخصائص ، بما في ذلك التناظر وشكل الجرس.

ما هي الظواهر بخلاف قرعة العملات التي تتبع التوزيع الطبيعي؟

بعض الأمثلة الرائعة هنا.

  • الارتفاع في عدد السكان - يقع المزيد من الأشخاص في مجموعة متوسط ​​الطول. من النادر أن تجد أي شخص طويل القامة أو قصير القامة للغاية. وتكاد تكون فرص العثور على شخص طويل جدًا وقصير للغاية متساوية.
  • رمي النرد
  • مقاس الحذاء
  • معدل الذكاء
  • والكثير غيرها ...

هل هذه الظواهر تتبع بدقة التوزيع الطبيعي؟

الجواب البسيط هو لا. على الرغم من ذلك ، كما رأينا أعلاه - كلما جربت أكثر ، زادت البيانات التي تتبع خصائص التوزيع العادية. لكن ليس هناك ما يضمن أن بعض الأحداث غير المحتملة لن تحدث على أي حال.

هل جميع التوزيعات الاحتمالية في الكون توزيع طبيعي؟

لا ، هناك العديد من الظواهر التي يحددها نوع آخر من التوزيع.

  • احتمالية وصول عدد معين من العملاء والمكالمات الهاتفية والحوادث والأحداث الرياضية والفيضانات تتبع Poisson Distribution .
  • بالنسبة لمبيعات الأعمال ، فإن 20٪ من عملاء الشركة مسؤولون عن 80٪ من المبيعات. ( توزيع باريتو )
  • أنماط حركة المرور في المدينة - التوزيع الأسي
  • اختيار عشوائي لأعضاء فريق من مجموعة من الفتيات والفتيان - التوزيع الهندسي المفرط

و أكثر من ذلك بكثير …

لقد أنتجت القائمة أعلاه من خلال البحث عن "مثال واقعي" على Google مع بعض التوزيعات المدرجة هنا - وهذا لا يعني أنني أفهمها جميعًا. 😉

هل هناك سبب يجعل بعض الظواهر الطبيعية تميل إلى اتباع التوزيع الطبيعي

نعم - نقلا عن توضيحي المفضل:

يتم إعطاء التفسير المعتاد باسم آخر للتوزيع العادي ، وهو "توزيع الخطأ". الفكرة هي أن الأخطاء عشوائية بشكل عام ، لذا من المرجح أن تسير في اتجاه واحد كما في الاتجاه الآخر. على سبيل المثال ، من المرجح أن يقوم الرامي بالتصويب قليلاً إلى اليسار ، أو قليلاً إلى اليمين ، أو مرتفع قليلاً إلى منخفض قليلاً. وبالتالي ، فإن الرسم البياني لمدى بعد الطلقات عن الهدف سيعكس هذا الاتجاه العشوائي ، ويكون متماثلًا حول الوسط. وبالمثل ، مع الطول والذكاء - تساهم العديد من الجينات (ربما الآلاف) في هذه النتائج ، كما يفعل عدد كبير من العوامل البيئية ، مثل التغذية والأمراض وانخفاض الدخل وما إلى ذلك.

معلمات التوزيع الطبيعي

إذا كان لديك حدس للمناقشة حتى الآن - فأنت بالفعل الفائز. تمت المهمة. بقية المقال مكافأة.

جميع الرسوم البيانية للتوزيع العادي التي تراها مختلفة في الشكل. البعض منهم أكثر تملقًا من البعض الآخر. البعض منهم لديه ارتفاعات جيدة. يتم التحكم في كل هذه الأشكال بواسطة معلمتين فقط:

تعني

يتم تحديد المتوسط ​​بالمتوسط. يحدد ارتفاع الجرس. بالنسبة لمثال قرعة العملة ، يكون المتوسط ​​قريبًا من 50 ، وهو الموقع العلوي في الرسم البياني.

الانحراف المعياري

بما أنني أعدك بأن هذه المقالة ستكون خالية من المعادلات ، فأنا لا أقدم تمثيلها الرياضي هنا. لكن الأمر ليس بهذه الصعوبة على أي حال. الانحراف المعياري هو مقياس لتمثيل مدى تنوع البيانات.

على سبيل المثال ، سيكون الانحراف المعياري للعمر في رعاية الأطفال أقل من الانحراف المعياري للعمر في نادي مشجعي كرة القدم ، نظرًا لأن الفجوة العمرية بين المجموعة الأصغر والأكبر سنًا يجب أن تكون أعلى بكثير في نادي مشجعي كرة القدم.

يحدد الانحراف المعياري عرض المنحنى. ينتج عن الانحراف المعياري الصغير منحنى شديد الانحدار ، وينتج عن الانحراف المعياري الأكبر منحنى أكثر انبساطًا.