کار با داده‌های فارسی در نرم‌افزار تحلیل شبکه Pajek

آموزش استفاده از داده‌های فارسی در تحلیل شبکه اجتماعی با استفاده از نرم‌افزار پاجک (Pajek)

دوستان عزیزی که در کارگاه تحلیل شبکه اجتماعی در دانشگاه مازندران شرکت کرده‌اند مخاطب اصلی این مطلب می‌باشند زیرا در کارگاه عنوان کردم که نحوه تبدیل داده‌های فارسی به ورودی نرم‌افزار تحلیل شبکه را خواهم گفت اما کمبود وقت و تغییرات برنامه اجازه این کار را نداد که در قالب این مطلب به طرح آن خواهم پرداخت؛ علاوه بر دوستان شرکت‌کننده در کارگاه مازندران، دوستان دیگری که علاقمند به استفاده از نرم‌افزار پاجک در تحلیل شبکه اجتماعی و با استفاده از داده‌های فارسی هستند می‌توانند در این مطلب چگونگی تبدیل داده‌های فارسی به ورودی نرم‌افزار پاجک را مشاهده کنند. لینک دانلود نمونه فایلهای استفاده شده در این آموزش در انتهای مطلب قرار داده شده است.

همانطور که در کارگاه تحلیل شبکه اجتماعی که در روزهای پنج‌شنبه و جمعه هفته گذشته در دانشگاه مازندران برگزار شد تاکید کردم، نرم‌افزارهای تحلیل شبکه اجتماعی به مانند بسیاری از دیگر نرم‌افزارها به طور اولیه، برای زبان انگلیسی و یا زبان‌های چپ به راست تهیه شده‌اند و در زبان‌هایی که از راست به چپ نوشته می‌شوند و همچنین داده‌هایی که به زبان فارسی ذخیره شده‌اند مشکلاتی پیش می‌آید که راه‌حل برخی از آنها استفاده از یونی‌کد (Unicode) یوتی‌اف-8 (UTF-8) می‌باشد که در این مطلب ارائه می‌گردد. لطفا برای دیدن نسخه بزرگتر عکس‌ها بر روی آنها کلیک نمایید

بعد از آن‌که داده‌های مختلفی که ناظر به ارتباط میان افراد مختلف (اعم از گروه‌ها، کنشگران فردی، مولکول‌ها، سازمان‌ها و…) می‌باشند را در قالب دو ستون در نرم‌افزار اکسل (و یا به صورت با فاصله‌ی تب (Tab-Delimited) در نرم‌افزارهای ویرایش متن) وارد نمودیم (که در شکل زیر نمونه‌ای از این داده‌ها در اکسل و نوت‌پد ارائه شده است)،

دو ستون از داده‌ها در اکسل

دو ستون از داده‌ها در نوت‌پد

اگر داده‌های ما فقط شامل 2 ستون بوده و افراد و ارتباطات آنها را دربرمی‌گرفت، همان دو ستون را در نرم‌افزار نوت‌پد ویندوز کپی کرده بعد با یونی‌کد یوتی‌اف-8 ذخیره می‌نماییم (به مانند شکل زیر)؛

ذخیره کرده داده‌ها با یونی‌کد یوتی‌اف-8 در نوت‌پد

ولی در صورتی که ستون سومی حاوی وزن، شدت و یا خصوصیت کمی دیگری از این ارتباطات را دارا باشیم، لازم است ستون سوم را نیز با فرمت شبیه دو ستون قبلی در فایل متنی اضافه و با یونی‌کد یوتی‌اف-8 ذخیره نماییم (به مانند شکل زیر)

داده‌های 3 ستونی در نوت‌پد، شبکه ارزش‌دار

که بعدا در هنگام ورود به نرم‌افزار تکست‌توپاجک (Text2Pajek) این ستون را به عنوان ستون وزن ارتباطات معرفی نماییم و به یک شبکه ارزش‌دار (Valued Network) برسیم. فرآیند ورود داده‌های قبل به نرم‌افزار تکست‌توپاجک و نیز ذخیره فایل ورودی نرم‌افزار پاجک در شکل زیر نشان داده شده است.

تبدیل فایل تکست به ورودی پاجک

همانطور که در شکل بالا مشخص است علی‌رغم ذخیره با یونی‌کد نرم‌افزار تکست‌توپاجک نوشته‌ها و نام ستون‌ها را تشخیص نداده‌است اما برای اینکه این امر خللی در تولید فایل فارسی ایجاد نکند لازم است بعد از به دست آوردن فایل شبکه که با پسوند نت (.net) ذخیره می‌شود، یک‌بار دیگر فایل نت ذخیره شده را با نرم‌افزار نوت‌پد باز کرده و با یونی‌کد یوتی‌اف-8 ذخیره نماییم این فرآیند در شکل زیر نمایش داده شده است

ذخیره یوتی‌اف-8 فایل شبکه

حال فایل شبکه ذخیره شده را به مانند شکل زیر در نرم‌افزار پاجک فراخوانده

بازکردن فایل شبکه در پاجک

و گراف اولیه این شبکه ارتباطات را با مراجعه به منوی مصورسازی یا ترسیم (Draw) می‌توان ترسیم کرد. (به مانند شکل زیر)

ترسیم گراف شبکه در منوی دراو

همانطور که در شکل زیر مشخص است با استفاده از این روش، برچسب‌های (Label) افراد یا راس‌ها (Vertex/Node) در شبکه به زبان فارسی نمایش داده می‌شود.

نمونه یک گراف با برچسبهای فارسی

برای امتحان روش گفته شده نمونه‌ی فایلهای استفاده شده را از اینجا دانلود نمایید؛ لطفا اگر سوال و یا ابهامی در استفاده از این روش پیش آمد  از طریق گذاشتن کامنت در زیر این مطلب بنده را مطلع فرمایید که پاسخ بگویم.

برای دریافت اطلاعات زمان و مکان برگزاری کارگاه بعدی تحلیل شبکه اجتماعی به این لینک مراجعه فرمایید.

Advertisements

12 thoughts on “کار با داده‌های فارسی در نرم‌افزار تحلیل شبکه Pajek

  1. سلام
    دوتا سوال داشتم که از همین جا ازتون پرسیدم
    سوالات به دستتون نرسید؟
    ضمنا دکتر فاضلی به من گفتن که با شما تماس بگیرم در رابطه با دوستان شما که کار تحلیل استنادی کرده بودند.
    متشکرم

  2. دوباره می پرسم
    برای فایل های تولید شده با اکسل چکار باید کرد؟ چون با نرم افزار اکسل تو پاژک جواب نمی ده
    البته اگر با فرمت تکست ذخیره کنیم ادامه ی راه یکی میشه.
    دوم: برای من در ترسیم نهایی حرف های چ-پ را نشان نمی دهد و حرف ی را به صورت متصل نمی نویسد مثلا می نویسد: …نجم بجای پنجم یا ب ی ست بجای بیست
    ممنون میشم راهنمایی کنید
    متشکرم
    علیزاده

    1. سلام

      در مورد کار تحلیل استنادی که دکتر فاضلی لطف کردن به شما اطلاع دادن، خدمت شما یه ایمیل می فرستم که در آن اطلاعات تماس دوستم که با تحلیل استنادی آشنایی داره رو براتون ارسال می کنم که انشاالله کمکتون کنه

      در مورد سوال شما در ارتباط با داده های فارسی در پاجک
      اینکه فرمودین فایل اگه با اکسل تولید شده باشه چه کار باید کرد دو مشکل پیش میاد اول اینکه در مرحله بعد نرم افزار اکسل تو پاجک نمی تونه ستون سوم رو که وزن ارتباطات (یا یه خاصیت کمی ارتباطات را در آن درج کرده ایم) وارد کنه و نیاز هست که از نرم افزار تکست تو پاجک برای این منظور استفاده کنیم یا اینکه با وارد کردن فایل اکسل به نودایکس‌ال این تبدیل رو انجام بدهیم که دردسرش بیشتر میشه

      مشکل دوم این هست که من تا الان ندیدم اکسل بتونه فایل تکست تب دلیمیتد با یونی‌کد یوتی‌اف8 بده به همین خاطر گفتم که داده ها رو از توی اکسل به نوت پد کپی کنید و از اونجا با یونی کد ذخیره کنید

      در مورد سوال دوم شما
      شما از فایل های مثالی که اینجا آپلود کردم استفاده کردید؟ توی اونها چ و پ در نمونه های شخص چهارم و پنجم که در تصویر هست مشکلی نداره و در مورد حرف ی هم همینطور، فکر می کنم مشکل از زبان سیستم شما باشه (که فارسی رو کامل ساپورت نکرده)، اگر ممکن هست لطفا روی یه سیستم دیگه امتحان کنید و من هم فایل های نمونه ای که گذاشتم رو روی یه سیستم دیگه امتحان می کنم، نتیجه رو لطفا همینجا کامنت بگذارید من هم اگر تفاوت داشت خدمت شما اینجا اطلاع می دهم
      موفق باشید

  3. سلام
    ببخشید که دیر شد
    کامپیوتری که بتونم روش پاژک نصب کنم پیدا نمیکردم
    روی کامپیوتر دیگری نصب کردم مشکل باقی بود ولی ظاهرا به خاطر فونت پیش فرض بود
    در قسمت آپشن فونت را تغییر دادیم مشکل برطرف شد.
    متشکرم

    1. سلام جناب علی زاده

      از لطف شما و تلاشتان برای امتحان این قضیه و اینکه راه‌حلی که پیدا کردین رو گفتین ممنونم امیدوارم بحث‌های اینچنینی میان مخاطبان سایت بیشتر ادامه یابد

      بله من هم امتحان کردم از قسمت تنظیمات پاجک (options) و وقتی یکی از فونتهای فارسی رو انتخاب می‌کنید مسئله جدا نوشتن ی برطرف میشود

      موفق باشید

  4. باسلام وعرض ادب
    نرم افزار vos viewer کلید واژه ها را به چه صورت انتخاب می نماید. آیا محدودیتی در تعداد کلیدواژه ها وجود دارد؟
    باسپاس

  5. با سلام و احترام.
    من پایان نامه م در مورد علم سنجی هست و بخشی از آن رو باید با فایل ها و نتایج استخراج شده از اسکوپوس در قالب csv،بااستفاده از scop2wos به قالب قابل تحلیل در نرم‌افزار Sci² Tool تبدیل گرددو پس از آن خروجی نرم افزار Sci² Tool با استفاده از نرم افزارVOSviewer به‌صورت مصور ترسیم شود. اما با هیچ کدوم از نرم افزار ها کار نکردم. اگه میتونید ی راهنمایی در مورد کار با این نرم افزارها لطف کنید به ایمیلم بفرستید. ممنون میشم

    1. با سلام و احترام.
      من تحقیقم در مورد ترسیم نقشه علم با ماتریس گیری هست و بخشی از آن رو باید با فایل ها و نتایج استخراج شده از اسکوپوس در قالب csv،بااستفاده از scop2wos به قالب قابل تحلیل در نرم‌افزار Sci² Tool تبدیل گرددو پس از آن خروجی نرم افزار Sci² Tool با استفاده از نرم افزارVOSviewer به‌صورت مصور ترسیم شود. اما با هیچ کدوم از نرم افزار ها کار نکردم. اگه میتونید ی راهنمایی در مورد کار با این نرم افزارها لطف کنید به ایمیلم بفرستید. ممنون میشم

  6. با عرض سلام وادب نباشید لطفا ابتدا برای ماتریس گیری اینجانب را راهنمایی نمایید با عرض تشکر و احترام الممیرا زیبائی

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s