دیتا فریم (Data frame)

دیتا فریم برای نگهداری داده های جدولی به کار می رود. در واقع دیتا فریم لیستی از بردارهای با طول یکسان است. در مثال زیر دیتافریم df شامل سه بردار n و s و b است.

R دارای داده های آماده ای از نوع دیتا فریم است. به عنوان مثال جدولی بنام mtcars به شکل زیر تعریف شده است .

خط بالای جدول که header نامیده می شود شامل نام ستونها می باشد. هر خط افقی یک ردیف جدول است و با نام ردیف شروع شده و در ادامه داده های واقعی قرار دارند. به هر عضو یک ردیف یک سلول گفته می شود.


دسترسی به داده ردیف اول و ستون دوم

برای  دسترسی به داده یک سلول از عملگر [] و شماره ردیف و ستون که با کاما از هم جدا شده اند استفاده می کنیم. ترتیب ردیف و ستون مهم است.

بجای شماره از اسم ستونها و ردیفها هم می توانیم استفاده کنیم.

تابع ()nrow تعداد ردیفهای یک جدول و تابع ()ncol تعداد ستونهای آن را بر می گرداند.

همچنین از توابع ()head و ()tail برای مشاهده ردیفهای ابتدایی و انتهایی یک جدول می توانیم استفاده کنیم.

برای دسترسی به ستونهای یک جدول از [[]] به همراه نام یا شماره ستون و یا عملگر $ به همراه نام ستون استفاده می کنیم. در صورتیکه از [] استفاده می کنیم باید شماره ردیف را مشخص نماییم و یا اینکه آنرا خالی بگذاریم که در این حالت به همه ردیفهای جدول اشاره می کند.

مشابه ساختارهای دیگر از بردار برای فیلتر کردن ستونهای یک جدول می توان استفاده کرد. مثلا بردار (c(1,4 برای انتخاب فقط ستونهای ۱ و ۴ همه ردیفها استفاده می شود.

دسترسی به داده های یک ردیف با استفاده از [] می باشد. در داخل [] بعد از شماره ردیف یا بردار ردیفها علامت کاما (,) الزامی است در غیر اینصورت R مقادیر ستونها را بر می گرداند. در همه موارد بجای شماره ردیف از نام ردیف داخل “ “ می توان استفاده کرد.

هم در مورد ستونها و هم ردیفها از علامت – در کنار شماره ستون یا شماره ردیف برای حذف (فیلتر کردن) آن می توان استفاده کرد.  بجای شماره می توان از برداری از شماره های مورد نظر نیز استفاده کرد.

نهایتا از عبارات منطقی برای انتخاب ردیفها یی از یک جدول استفاده می شود.

ذکر این نکته خالی از لطف نیست که دستوراتی که در این قسمت گفته شد عملکردی مشابه Query در سیستمهای پایگاه داده دارد.

مطالب مرتبط