چگونه رگرسیون را در اکسل اجرا کنیم

فهرست مطالب:

چگونه رگرسیون را در اکسل اجرا کنیم
چگونه رگرسیون را در اکسل اجرا کنیم
Anonim

رگرسیون در اکسل روشی برای خودکار کردن فرآیند آماری مقایسه چندین مجموعه اطلاعات برای مشاهده اینکه چگونه تغییرات در متغیرهای مستقل بر تغییرات متغیرهای وابسته تأثیر می‌گذارد. اگر تا به حال می‌خواهید بین دو چیز همبستگی پیدا کنید، استفاده از تحلیل رگرسیون در اکسل یکی از بهترین راه‌ها برای انجام این کار است.

دستورالعمل‌های این مقاله برای Excel 2019، Excel 2016، Excel 2013، Excel 2010 اعمال می‌شود.

معنای رگرسیون چیست؟

رگرسیون یک رویکرد مدل‌سازی آماری است که تحلیل‌گران برای تعیین روابط بین چندین متغیر از آن استفاده می‌کنند.

تحلیل رگرسیون با یک متغیر منفرد که در تلاش برای تجزیه و تحلیل آن هستید و متغیرهای مستقلی که در حال آزمایش آن هستید شروع می شود تا ببینید آیا آنها بر آن متغیر منفرد تأثیر می گذارند یا خیر.تجزیه و تحلیل به تغییرات در متغیرهای مستقل نگاه می کند و تلاش می کند تا این تغییرات را با تغییرات حاصل در متغیر منفرد (وابسته) مرتبط کند.

ممکن است این مانند آمارهای پیشرفته به نظر برسد، اما اکسل این تجزیه و تحلیل پیچیده را در دسترس همه قرار می دهد.

انجام رگرسیون خطی در اکسل

ساده ترین شکل تحلیل رگرسیون، رگرسیون خطی است. رگرسیون خطی ساده فقط به رابطه بین دو متغیر نگاه می کند.

برای مثال، صفحه گسترده زیر داده هایی را نشان می دهد که حاوی تعداد کالری هایی است که یک فرد در هر روز خورده و وزن او در آن روز.

Image
Image

از آنجایی که این صفحه‌گسترده حاوی دو ستون داده است و یک متغیر به طور بالقوه می‌تواند روی دیگری تأثیر بگذارد، می‌توانید با استفاده از Excel یک تحلیل رگرسیونی روی این داده‌ها اجرا کنید.

فعال کردن افزونه Analysis ToolPak

قبل از اینکه بتوانید از ویژگی تجزیه و تحلیل رگرسیون اکسل استفاده کنید، باید افزونه Analysis ToolPak را در صفحه گزینه های Excel فعال کنید.

  1. در اکسل، منوی File را انتخاب کنید و Options را انتخاب کنید. را انتخاب کنید.

    Image
    Image
  2. Add-ins را در منوی پیمایش سمت چپ انتخاب کنید. سپس، مطمئن شوید که Excel Add-ins در قسمت Manage انتخاب شده است.

    Image
    Image
  3. در نهایت، دکمه Go را انتخاب کنید.

    Image
    Image
  4. در پنجره بازشوی افزونه‌ها. Analysis ToolPack را با کلیک کردن روی کادر جلوی آن برای اضافه کردن علامت علامت فعال کنید و OK را انتخاب کنید.

    Image
    Image

اکنون که Analysis ToolPak فعال شده است، آماده شروع تجزیه و تحلیل رگرسیون در اکسل هستید.

نحوه انجام رگرسیون خطی ساده در اکسل

با استفاده از صفحه گسترده وزن و کالری به عنوان مثال، می توانید تجزیه و تحلیل رگرسیون خطی را در Excel به صورت زیر انجام دهید.

  1. منوی Data را انتخاب کنید. سپس، در گروه Analysis ، Analysis را انتخاب کنید.

    Image
    Image
  2. در پنجره تحلیل داده ، Regression را از لیست انتخاب کنید و OK را کلیک کنید.

    Image
    Image
  3. Input Y Range محدوده سلول هایی است که حاوی متغیر وابسته است. در این مثال، این وزن است. Input X Range محدوده سلول هایی است که حاوی متغیر مستقل است. در این مثال، این ستون کالری است.

    Image
    Image
  4. Labels را برای سلول‌های سرصفحه انتخاب کنید و سپس New Worksheet را انتخاب کنید تا نتایج به کاربرگ جدید ارسال شود. OK را انتخاب کنید تا اکسل تجزیه و تحلیل را اجرا کند و نتایج را در یک برگه جدید ارسال کند.

    Image
    Image
  5. کاربرگ جدید را بررسی کنید. خروجی تجزیه و تحلیل تعدادی مقادیر دارد که برای تفسیر نتایج باید آنها را درک کنید.

    Image
    Image

    هر یک از این اعداد معانی زیر دارند:

    • R چندگانه: ضریب همبستگی. 1 نشان دهنده همبستگی قوی بین دو متغیر است، در حالی که -1 به معنای وجود یک رابطه منفی قوی است. 0 به این معنی است که هیچ ارتباطی وجود ندارد.
    • R مربع: ضریب تعیین، که نشان می دهد چند نقطه بین دو متغیر روی خط رگرسیون قرار می گیرند. از نظر آماری، این مجموع مجذور انحرافات از میانگین است.
    • مربع R تنظیم شده: یک مقدار آماری به نام مربع R که برای تعداد متغیرهای مستقلی که انتخاب کرده‌اید تنظیم می‌شود.
    • خطای استاندارد: نتایج تحلیل رگرسیون چقدر دقیق هستند. اگر این خطا کوچک است، نتایج رگرسیون شما دقیق تر است.
    • مشاهدات: تعداد مشاهدات در مدل رگرسیونی شما.

    مقادیر باقیمانده در خروجی رگرسیون جزئیاتی را در مورد اجزای کوچکتر در تحلیل رگرسیون به شما می دهد.

    • df: مقدار آماری شناخته شده به عنوان درجات آزادی مربوط به منابع واریانس.
    • SS: مجموع مربع ها. اگر بیشتر داده‌های شما با خط رگرسیون مطابقت داشته باشند، نسبت مجموع باقی‌مانده مربع‌ها به کل SS باید کوچکتر باشد.
    • MS: میانگین مربع داده رگرسیون.
    • F: آماره F (آزمون F) برای فرضیه صفر. این اهمیت مدل رگرسیون را نشان می دهد.
    • اهمیت F: مقدار آماری شناخته شده به عنوان P-value F.

    تا زمانی که آمار و مدل های رگرسیون را محاسبه نکنید، مقادیر پایین خلاصه معنای زیادی نخواهند داشت. با این حال، مربع R و R چندگانه دو مهم‌ترین آنها هستند.

همانطور که می بینید، در این مثال، کالری ها با وزن کل همبستگی قوی دارند.

تحلیل رگرسیون خطی چندگانه در اکسل

برای انجام همان رگرسیون خطی اما با چندین متغیر مستقل، کل محدوده (چند ستون و ردیف) را برای Input X Range انتخاب کنید.

Image
Image

هنگام انتخاب چندین متغیر مستقل، احتمال کمتری وجود دارد که یک همبستگی قوی پیدا کنید زیرا متغیرهای زیادی وجود دارد.

اما تجزیه و تحلیل رگرسیون در اکسل می تواند به شما کمک کند تا با بررسی دستی داده ها، همبستگی هایی را با یک یا چند مورد از آن متغیرهایی که ممکن است متوجه وجود آنها نباشید، پیدا کنید.

توصیه شده: