رگرسیون در اکسل روشی برای خودکار کردن فرآیند آماری مقایسه چندین مجموعه اطلاعات برای مشاهده اینکه چگونه تغییرات در متغیرهای مستقل بر تغییرات متغیرهای وابسته تأثیر میگذارد. اگر تا به حال میخواهید بین دو چیز همبستگی پیدا کنید، استفاده از تحلیل رگرسیون در اکسل یکی از بهترین راهها برای انجام این کار است.
دستورالعملهای این مقاله برای Excel 2019، Excel 2016، Excel 2013، Excel 2010 اعمال میشود.
معنای رگرسیون چیست؟
رگرسیون یک رویکرد مدلسازی آماری است که تحلیلگران برای تعیین روابط بین چندین متغیر از آن استفاده میکنند.
تحلیل رگرسیون با یک متغیر منفرد که در تلاش برای تجزیه و تحلیل آن هستید و متغیرهای مستقلی که در حال آزمایش آن هستید شروع می شود تا ببینید آیا آنها بر آن متغیر منفرد تأثیر می گذارند یا خیر.تجزیه و تحلیل به تغییرات در متغیرهای مستقل نگاه می کند و تلاش می کند تا این تغییرات را با تغییرات حاصل در متغیر منفرد (وابسته) مرتبط کند.
ممکن است این مانند آمارهای پیشرفته به نظر برسد، اما اکسل این تجزیه و تحلیل پیچیده را در دسترس همه قرار می دهد.
انجام رگرسیون خطی در اکسل
ساده ترین شکل تحلیل رگرسیون، رگرسیون خطی است. رگرسیون خطی ساده فقط به رابطه بین دو متغیر نگاه می کند.
برای مثال، صفحه گسترده زیر داده هایی را نشان می دهد که حاوی تعداد کالری هایی است که یک فرد در هر روز خورده و وزن او در آن روز.
از آنجایی که این صفحهگسترده حاوی دو ستون داده است و یک متغیر به طور بالقوه میتواند روی دیگری تأثیر بگذارد، میتوانید با استفاده از Excel یک تحلیل رگرسیونی روی این دادهها اجرا کنید.
فعال کردن افزونه Analysis ToolPak
قبل از اینکه بتوانید از ویژگی تجزیه و تحلیل رگرسیون اکسل استفاده کنید، باید افزونه Analysis ToolPak را در صفحه گزینه های Excel فعال کنید.
-
در اکسل، منوی File را انتخاب کنید و Options را انتخاب کنید. را انتخاب کنید.
-
Add-ins را در منوی پیمایش سمت چپ انتخاب کنید. سپس، مطمئن شوید که Excel Add-ins در قسمت Manage انتخاب شده است.
-
در نهایت، دکمه Go را انتخاب کنید.
-
در پنجره بازشوی افزونهها. Analysis ToolPack را با کلیک کردن روی کادر جلوی آن برای اضافه کردن علامت علامت فعال کنید و OK را انتخاب کنید.
اکنون که Analysis ToolPak فعال شده است، آماده شروع تجزیه و تحلیل رگرسیون در اکسل هستید.
نحوه انجام رگرسیون خطی ساده در اکسل
با استفاده از صفحه گسترده وزن و کالری به عنوان مثال، می توانید تجزیه و تحلیل رگرسیون خطی را در Excel به صورت زیر انجام دهید.
-
منوی Data را انتخاب کنید. سپس، در گروه Analysis ، Analysis را انتخاب کنید.
-
در پنجره تحلیل داده ، Regression را از لیست انتخاب کنید و OK را کلیک کنید.
-
Input Y Range محدوده سلول هایی است که حاوی متغیر وابسته است. در این مثال، این وزن است. Input X Range محدوده سلول هایی است که حاوی متغیر مستقل است. در این مثال، این ستون کالری است.
-
Labels را برای سلولهای سرصفحه انتخاب کنید و سپس New Worksheet را انتخاب کنید تا نتایج به کاربرگ جدید ارسال شود. OK را انتخاب کنید تا اکسل تجزیه و تحلیل را اجرا کند و نتایج را در یک برگه جدید ارسال کند.
-
کاربرگ جدید را بررسی کنید. خروجی تجزیه و تحلیل تعدادی مقادیر دارد که برای تفسیر نتایج باید آنها را درک کنید.
هر یک از این اعداد معانی زیر دارند:
- R چندگانه: ضریب همبستگی. 1 نشان دهنده همبستگی قوی بین دو متغیر است، در حالی که -1 به معنای وجود یک رابطه منفی قوی است. 0 به این معنی است که هیچ ارتباطی وجود ندارد.
- R مربع: ضریب تعیین، که نشان می دهد چند نقطه بین دو متغیر روی خط رگرسیون قرار می گیرند. از نظر آماری، این مجموع مجذور انحرافات از میانگین است.
- مربع R تنظیم شده: یک مقدار آماری به نام مربع R که برای تعداد متغیرهای مستقلی که انتخاب کردهاید تنظیم میشود.
- خطای استاندارد: نتایج تحلیل رگرسیون چقدر دقیق هستند. اگر این خطا کوچک است، نتایج رگرسیون شما دقیق تر است.
- مشاهدات: تعداد مشاهدات در مدل رگرسیونی شما.
مقادیر باقیمانده در خروجی رگرسیون جزئیاتی را در مورد اجزای کوچکتر در تحلیل رگرسیون به شما می دهد.
- df: مقدار آماری شناخته شده به عنوان درجات آزادی مربوط به منابع واریانس.
- SS: مجموع مربع ها. اگر بیشتر دادههای شما با خط رگرسیون مطابقت داشته باشند، نسبت مجموع باقیمانده مربعها به کل SS باید کوچکتر باشد.
- MS: میانگین مربع داده رگرسیون.
- F: آماره F (آزمون F) برای فرضیه صفر. این اهمیت مدل رگرسیون را نشان می دهد.
- اهمیت F: مقدار آماری شناخته شده به عنوان P-value F.
تا زمانی که آمار و مدل های رگرسیون را محاسبه نکنید، مقادیر پایین خلاصه معنای زیادی نخواهند داشت. با این حال، مربع R و R چندگانه دو مهمترین آنها هستند.
همانطور که می بینید، در این مثال، کالری ها با وزن کل همبستگی قوی دارند.
تحلیل رگرسیون خطی چندگانه در اکسل
برای انجام همان رگرسیون خطی اما با چندین متغیر مستقل، کل محدوده (چند ستون و ردیف) را برای Input X Range انتخاب کنید.
هنگام انتخاب چندین متغیر مستقل، احتمال کمتری وجود دارد که یک همبستگی قوی پیدا کنید زیرا متغیرهای زیادی وجود دارد.
اما تجزیه و تحلیل رگرسیون در اکسل می تواند به شما کمک کند تا با بررسی دستی داده ها، همبستگی هایی را با یک یا چند مورد از آن متغیرهایی که ممکن است متوجه وجود آنها نباشید، پیدا کنید.