مشکل در استفاده از mpirun و کلاستر کردن (حل شد)

شبکه با فدورا از قبیل dhcp, IP numbers, wlan, modems, etc
پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

مشکل در استفاده از mpirun و کلاستر کردن (حل شد)

پستتوسط moji_helooo » پنج شنبه 10 شهریور 1395, 4:25 am

سلام به همه. ۲ تا سیستم فدورا ۲۴ توی لن رو می‌خواستم کلاستر کنم با استفاده از mpi. یه فولدر ساختم و اون رو توسط nfs به اشتراک گذاشتم. طوری که از اون سیستم وقتی دستور
کد: انتخاب همه
showmount -e 192.168.6.68

رو می‌زنم خروجی زیر میاد:
کد: انتخاب همه
Export list for 192.168.6.68:
/home/mpiuser/cloud 192.168.6.225

حالا من توی این فولدر cloud یه فایل کامپایل شده با mpicc رو گذاشتم. بعد دستور زیر رو می‌زنم:
کد: انتخاب همه
mpirun -np 3 192.168.6.225 ./cpi

و خروجی زیر میاد:
کد: انتخاب همه
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file 192.168.6.225 (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file 192.168.6.225 (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file 192.168.6.225 (No such file or directory)


مشکل کارم کجاست؟ چطور استفاده کنم؟
راستی اصن فولدر cloud من به درستی share شده؟ اصن چطوری از اون یکی سیستم به این فولدر share شده دسترسی پیدا کنم بدون استفاده از ssh؟
آخرین بار توسط moji_helooo در یکشنبه 28 شهریور 1395, 6:05 pm ویرایش شده است، در کل 2 بار ویرایش شده است.

معاونت سایت
آواتار کاربر
پست: 6427
تاریخ عضویت: دوشنبه 21 مرداد 1387, 11:47 pm
محل اقامت: اصفهان

Re: مشکل در استفاده از mpirun

پستتوسط hedayat » شنبه 12 شهریور 1395, 12:16 am

shareه nfs رو باید توی سیستم‌(ها)ی کلاینت mount کنید.

بعد به نظر میرسه که دستور mpirunتون هم اشتباهه. هر چند من نمیدونم چی هست ساختارش ولی ظاهرا آدرس آی‌پی رو به عنوان اسم فایل گرفته!

پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

Re: مشکل در استفاده از mpirun

پستتوسط moji_helooo » شنبه 13 شهریور 1395, 5:19 pm

بله درست می فرمایید. من share شده‌ی nfs رو توی کلاینت‌ها مونت نکردم. اما من این کار رو انجام می‌دم. از سیستم خودم که سرور هست با استفاده از ssh رفتم تو اون یکی و این دستور رو می‌زنم:
کد: انتخاب همه
[[email protected] mpiuser]# mount -t 192.168.6.68:/home/mpiuser/cloud /home/mpiuser/cl/


و این خروجی میاد:

کد: انتخاب همه
mount: can't find /home/mpiuser/cl/ in /etc/fstab


اگر بدون -t بزنم یعنی این دستور رو بزنم:
کد: انتخاب همه
[[email protected] mpiuser]# mount 192.168.6.68:/home/mpiuser/cloud /home/mpiuser/cl/

این خروجی میاد:
کد: انتخاب همه
mount.nfs: access denied by server while mounting 192.168.6.68:/home/mpiuser/cloud


چرا نمی‌تونم این فولدر شید شده رو اون ور مونت کنم؟

معاونت سایت
آواتار کاربر
پست: 6427
تاریخ عضویت: دوشنبه 21 مرداد 1387, 11:47 pm
محل اقامت: اصفهان

Re: مشکل در استفاده از mpirun

پستتوسط hedayat » یکشنبه 14 شهریور 1395, 10:22 pm

مشکلی توی تنظیمات nfs توی سرور هست احتمالا. در ضمن فایروال رو هم چک کنید که باز باشه برای nfs. در ضمن اگه t- میزنید بعدش هم باید یک نوع بزنید. توی سرور تو فایروال پورت مخصوص nfs رو باز کنید. توی کلاینت هم توی دستور mount بزنید t nfs4-

پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

Re: مشکل در استفاده از mpirun

پستتوسط moji_helooo » دوشنبه 15 شهریور 1395, 8:32 pm

من هم تنظیمات مربوط به فایروال رو انجام دادم با دستورات زیر:
کد: انتخاب همه
firewall-cmd --permanent --zone public --add-service mountd
firewall-cmd --permanent --zone public --add-service rpc-bind
firewall-cmd --permanent --zone public --add-service nfs
firewall-cmd --reload

هم اینکه اصن حالت خاموش کردن فایروال رو هم امتحان کردم. اونم با دستور زیر:
کد: انتخاب همه
service firewalld stop

و باز هم نشد.

حالت -t nfs4 رو هم توی کلاینت امتحان کردم. بازم نشد.

پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

Re: مشکل در استفاده از mpirun

پستتوسط moji_helooo » سه شنبه 15 شهریور 1395, 3:31 am

درست شد. تونستم از توی کلاینت مونت کنم. توی تنظیمات nfs server configuration یه برنامه‌ی گرافیکی هست با چک باکس‌ها بازی کرده بودم تنظیمات اولیه رو ریخته بودم به هم.

حالا من با استفاده از دستور mpirun می‌خوام پردازش توزیع شده داشته باشم به صورت زیر استفاده می‌کنم:
کد: انتخاب همه
mpirun -np 3 -hosts slave1 ./cpi


و اررور زیر میاد.
کد: انتخاب همه
Permission denied, please try again.
Permission denied, please try again.
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).


فک کنم باز توی شیر کردن فولدر باید کاری می‌کردم و نکردم. می‌شه راهنمایی کنید؟

معاونت سایت
آواتار کاربر
پست: 6427
تاریخ عضویت: دوشنبه 21 مرداد 1387, 11:47 pm
محل اقامت: اصفهان

Re: مشکل در استفاده از mpirun

پستتوسط hedayat » سه شنبه 16 شهریور 1395, 5:13 pm

این خطا شبیه خطاهای ssh هست.

پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

Re: مشکل در استفاده از mpirun

پستتوسط moji_helooo » چهارشنبه 17 شهریور 1395, 12:36 pm

من از ssh استفاده کردم و متصل شدم. بله به نظر میاد بخاطر ssh باشه. چون mpi از ssh استفاده می‌کنه. یه جایی توی پیکربندی تنظیمات اشتباه کردم یا باید چیزی رو ست می‌کردم و نکردم. اما نمی‌دونم کجا و چرا؟

معاونت سایت
آواتار کاربر
پست: 6427
تاریخ عضویت: دوشنبه 21 مرداد 1387, 11:47 pm
محل اقامت: اصفهان

Re: مشکل در استفاده از mpirun

پستتوسط hedayat » چهارشنبه 17 شهریور 1395, 10:37 pm

منم نمیدونم دقیقا چه اتفاقی افتاده و کجا اشتباه کردید. اگه برنامه ازتون رمز نمی پرسه احتمالا باید کلید بسازید یا ssk-keygenو اون رو با ssh-copy-id کپی کنید به سرور.

پست: 210
تاریخ عضویت: پنج شنبه 19 مرداد 1391, 6:07 pm

Re: مشکل در استفاده از mpirun

پستتوسط moji_helooo » پنج شنبه 18 شهریور 1395, 11:54 am

آقا هدایت دستتون درد نکنه. راهنمای‌ای که کردید خوب بود و تونستم ssh رو passwordless کنم و دیگه اون error نیومد. اما حالا که اجرا کد رو توسط mpirun اجرا می‌کنم توسط دستور زیر:
کد: انتخاب همه
mpirun -n 8 --hosts slave1 sample_mpi

این error میاد:
کد: انتخاب همه
[proxy:0:[email protected]] HYDU_sock_connect (utils/sock/sock.c:138): unable to get host address for master (1)
[proxy:0:[email protected]] main (pm/pmiserv/pmip.c:189): unable to connect to server master at port 39039 (check for firewalls!)

این دستور داره توسط سیستم master اجرا می‌شه. این کار رو هم با حالت فایروال خاموش امتحان کردم و هم با حالت غیر خاموش و با همین اررور مواجه شدم. البته این کد یه مشکلی داره. چون اگه انتخاب کنم که روی master اجرا شه توسط دستور زیر:
کد: انتخاب همه
mpirun -n 8 --hosts master sample_mpi

با خروجی زیر مواجه می‌شم:
کد: انتخاب همه
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)
[proxy:0:[email protected]] HYDU_create_process (utils/launch/launch.c:75): execvp error on file sample_mpi (No such file or directory)

اگر توسط mpi من درست کار می‌کرد و دو سیستم کلاستر می‌شدند، زمانی که کد رو روی slave1 اجرا می‌کردم هم باید همین error میومد. ایده‌ای دارید که مشکل از کجاست و باید چطور حلش کنم؟

بعدی

بازگشت به شبکه

چه کسی آنلاین است

کاربران حاضر در این انجمن : کاربر عضو شده ای موجود نیست و 1 مهمان