Sunday, June 12, 2022




    হঠাৎ একটা প্রয়োজনে একটা ফোল্ডারের সব ফাইলের নাম চেঞ্জ করা দরকার হলো। ২৭টি ফাইলে একটি একটি করে কাজ করতে সময় লাগবে অনেক। তার চেয়ে খারাপ হলো বিরক্তি। মনে পড়ল লিনাক্স কমান্ড লাইনের কথা। মনে হতেই ব্যাশে গিয়ে কোড লিখলাম। 

    এ কাজের জন্য এক লাইনের কোডই যথেষ্ট। 




    এখানে একটি লুপ তৈরি করা হয়েছে। do এবং done দিয়ে লুপ শুরু ও শেষ হয়েছে। tr দিয়ে মূলত রিনেম করা হয়েছে। এখানে যেহেতু আমরা স্পেসকে পরিবর্তন করেছি তাই tr এর পরে ' ' দেওয়া হয়েছে। অন্য কিছু চেঞ্জ করতে হলে ' ' এর ভেতরে লিখলেই হবে। যেমন a বদলাতে চাইলে হবে tr 'a'। একইভাবে ঠিক পরের অংশ লিখতে হবে। 

    আর বিশেষ কিছু ফাইল চেঞ্জ করতে চাইলে তা * এর পরে লিখতে হবে। যেমন শুধু পিডিএফ (pdf) ফাইলগুলো রিনেম করতে হবে in *.pdf;। 

    লিনাক্সে mv কমান্ড দিয়েই মূলত রিনেম করা হয়। আর লুপের জন্যেই ডলার সাইন দেওয়া হয়েছে। 
    Category: articles

    Monday, August 30, 2021

     হ্যাঁ, R এর ggplot2 প্যাকেজে পাই চার্টের মতো নান্দনিক চার্ট আঁকার সরাসরি কোনো উপায় নেই। আঁকতে হয় বার চার্ট থেকে ঘুরিয়ে। কিন্তু আসলেই কি চার্ট দুটো আলাদা? আসলে তো পাই চার্টও এক ধরনের বার চার্টই! যেখানে বারগুলো সোজা দাঁড়িয়ে না থেকে বৃত্তাকার পথে চলছে। উপরের দিকে না গিয়ে ঘুরছে। 

    এই যে চার্টটিই দেখুন। পাই চার্টের এরিয়াগুলোকে চাইলে আপনি কৌণিক পথ বেয়ে চলা বার বা স্তম্ভ মনে করতে পারেন। 

    এখন আমরা ধাপে ধাপে দেখব, কীভাবে বার চার্টটিকে আপনি পাই চার্টে রূপান্তরিত করবেন। 

    আমরা কাজ করব নিচের ডেটাটি দিয়ে। এটা হলো যুক্তরাষ্ট্রের বিভিন্ন জাতিগোষ্ঠীর মানুষের শতাংশ। 


    এবার এখান থেকে বার চার্টটি আগে এঁকে ফেলি। বার চার্টের সংখ্যাগুলো একটি কলামে উপস্থিত থাকলে geom_bar() এর ভেতরে stat="identity" দিতে হয়। আর যদি এভাবে থাকে: true, false, false, true ইত্যাদি, তাহলে stat="identity" দেওয়া লাগবে না। width না দিলেও হবে। সেক্ষেত্রে স্বয়ংক্রিয়ভাবে বারগুলো মোটা বা চিকন হবে। 



    %>% চিহ্নটির নাম পাইপ অপারেটর। এভাবে লেখা আর ggplot(data=us_races, aes...) লেখা একই কথা। তবে এটা ব্যবহার করতে হলে tidyverse প্যাকেজ লোড করে নিলেই। একই সাথে পাইপের magrittr, ggplot2, dplyrসহ অনেকগুলো দরকারি প্যাকেজ লোড হয়ে যাবে। 


    এবারে RColorBrewer প্যাকেজ দিয়ে বারের কালারগুলো সাজিয়ে নেই। না করলেও ক্ষতি নেই। পাশাপাশি বারের মধ্যেই প্রতিটি বারের সাথে সংশ্লিষ্ট সংখ্যাগুলো দেখিয়ে দেই। 


     

    খেয়াল করুন বারে ডান পাশে লিজেন্ড থাকার আসলে কোনো প্রয়োজন নেই। এটাকে ফেলেই দেওয়া যায়। 



    এবার পাই চার্ট বানানো শুরু করা যাক। প্রথম কাজ হলো, x অক্ষে Race রাখা যাবে না। পাই চার্টে যেহেতু এরিয়াগুলো একটা আরেকটার ওপরে থাকবে, তাই y অক্ষে সংখ্যাগুলো বসিয়ে Race দিয়ে কালার করে নিচ্ছি। 




    এটাকে পাই চার্ট বলার সময় হয়নি এখনও। পাই চার্ট হবার জন্যে প্রস্তুত বলতে পারি। 

    এখন সে কাজটাই করব। বারগুলোকে ঘুরিয়ে দিতে হবে। এটাই করবে coord_polar() ফাংশনটা। 



    দেখতে পাই চার্টের মতোই হয়েছে। তবে x অক্ষ, y অক্ষ ও আরও নানান জায়গায় অপ্রয়োজনীয় জিনিসে ভর্তি। এগুলো সরিয়ে একটু ক্লিন করি। theme_void() কাজটা করে দেবে। 




    এখন মোটামুটি কাজ চলার অবস্থায় আছে। এখনও অনেক কাজ করার সুযোগ আছে। লিজেন্ড না দিয়ে এরিয়ার ওপরই লেবেল দিয়ে দিলে ভাল হয়। এছাড়াও এরিয়ার মধ্যেই সংখ্যা বা পারসেন্টেজ দেখানো যায়। আমাদের ডেটায় অবশ্য সংখ্যাগুলোই পারসেন্টেজ। তাই দুটো একই কথা। 



    এবার কালার কম্বিনেশন আরেকটু ঠিক করে নেই। 






    চাইলে তো আরও কত কিছুই করা যায়। করার আগে চিন্তা করতে হবে সেটা কতটা অর্থবহ। 

    পাই চার্ট ভাল না লাগলে যদি ডোনাট চার্ট আঁকতে চান, সেটাও করতে পারেন। 

    Category: articles

    Saturday, August 28, 2021

     পত্রিকার পাতা খুললেই ইদানিং সুন্দর সুন্দর ডোনাট চার্ট দেখা যায়। এগুলোও আসলে পাই চার্টই। তবে মাখখানে থাকে একটি ছিদ্র। 

    কিছু দিন মনে করতাম, R মনে হয় এমন প্লট বানাতে পারে না। মজার ব্যাপার হলো, অন্য কেউ পারে R পারবে না এমনটা হতেই পারে না। হলে এমন হতে পারে যে R পারে কিন্তু অন্যরা (যেমন এক্সেল, SPSS পাইথন) পারে না। 

    এই প্লটটাও R-এই বানিয়েছি।

    এমনিতে R-এর ggplot2 প্যাকেজে পাই চার্ট বানানোর জন্যে কোনো ফাংশন নেই। তবে একটু ঘুরিয়ে চিন্তা করলেই বোঝা যায়, পাই চার্ট আসলে এক ধরনের বার চার্টই। তবে বারগুলো খাড়াভাবে না থেকে কৌণিকভাবে অবস্থান করছে। একটা যেখানে শেষ আরেকটা সেখানে শুরু। 

    ওপরের ডোনাট চার্টটির দিকেই দেখুন। এরিয়াগুলোকে চাইলেই বার হিসেবে কল্পনা করতে পারেন। অতএব, ডোনাট চার্টের কায়দা কানুন বুঝতে হলে বার চার্ট বানানোর নিয়ম জানতে হবে। একদম চিন্তা নেই, অনেকগুলো পোস্টে সেটা আমরা ব্যাখ্যা করেছি। 

    ☛ বার প্লট বানানোর কায়দা কানুন

    তাহলে বানিয়ে ফেলি। ও, আগে কিছু ডেটা বানিয়ে নেই। টেবিলটা উইকিপিডিয়া থেকে নেওয়া। 



    এখানে আমি ডেটাফ্রেইম তৈরি করার জন্যে tidyverse প্যাকেজমালার tibble() ফাংশন ব্যবহার করেছি। এভাবে করতে হলে আপনাকে library(tidyverse) কমান্ড দিয়ে এটা লোড করে নিতে হবে। চাইলে এটা লোড না করেও ডেটা বানাতে পারেন। সেক্ষেত্রে ফাংশনটা হবে data.frame()। তবে tidyverse লোড করলে সাথে সাথে ggplot2ও লোড হয়ে যায়। আলাদাভাবে ggplot2 লোড করতে রান করুন library(ggplot2)।  


    এবার প্লট করে ফেললেই হলো। 

     

    বার প্লট বোঝার পরেও এটা না বুঝতে না পারলে কিছু ব্যাপার খেয়াল করুন:`

    • এখানে পাই চার্ট বানানোর সুবিদার্থে আমরা geom_bar এর বদলে geom_col ব্যবহার করেছি। 
    • xlim দিয়ে ডোনাটের পুরুত্ব ঠিক করা হয়েছে। এর ওপর নির্ভর করে পাইয়ের ভেতরের ছিদ্র ছোট-বড় হবে।
    • মূলত coord_polar দিয়ে বারগুলোকে কৌণিক রূপ দেওয়া হয়েছে।
    • theme_void দিয়ে অপ্রয়োজনীয় ব্যাকগ্রাউন্ড রিমুভ করা হয়েছে। 
    • geom_text সম্পর্কে আরও জানতে এই লেখাটি দেখুন। 
    • বাকি জিনিসগুলো বিভিন্ন লেখায় আগেই বলেছি। দেখতে চাইলে দেখে নিন
    • প্লট কালারিং করার নানান উপায় দেখুন এখানে

    আজ এ পর্যন্তই। 
    Category: articles

    Thursday, July 22, 2021

     ধরুন আমাদের কাছে একটি ডেটাফ্রেইম আছে যাতে অনেকগুলো কলাম আছে। এগুলোর সবগুলোর গড় , মধ্যমা বা পরিমিত ব্যবধান আমরা এক কমান্ডেই বের করতে চাই। 

    আজকের পোস্টে আমরা R-এর বিল্ট-ইন ডেটাসেট airquality ব্যবহার করব। এতে ৬টি কলাম বা চলক আছে। Rstudio ব্যবহার করলে আপনি View(airquality) দিয়ে ডেটাকে একনজর দেখে নিতে পারেন। Rstudio ব্যবহার না করে থাকলে প্রথমে ডেটাকে লোড করে নিতে হবে।  


    এবার str দিয়ে দেখে নিতে পারেন কলাম বা চলকগুলো কী ধরনের। দেখা যাবে, পাঁচটি কলামই পূর্ণ সংখ্যা দিয়ে তৈরি। একটিতে আছে ভগ্নাংশ। তাহলে সবগুলো কলামই সংখ্যাবাচক। 

    তাহলে এবার গড় করে ফেলি। 

    স্বাভাবিক উপায়ে গড় বের করতে গেলে হয়ত আমরা এভাবে করব:


    এখানে na.rm = TRUE দেওয়ার কারণ হলো, ডেটায় কিছু মিসিং ভ্যালু  (NA) আছে। এই কথা দিয়ে আমরা বলে দিয়েছি, সেগুলোকে বাদ দিয়ে হিসাব করে দাও। 

    কিন্তু এভাবে একটা একটা করে গড় বের করা প্রোগ্রামিং-এর আদর্শ বিরোধী। কাজটা করে ফেলতে হবে একটা কমান্ড দিয়েই। আর সেটা করার উপায় আছে বেশ কয়েকটি। 

    আমরা চাইলে এভাবে করতে পারি:

     

     এখানে 2 দিয়ে বোঝানো হলো, আমরা কলামের গড় চাই। সারির (row) গড় চাইলে দিতাম ১। খেয়াল করে দেখুন চলকের নামসহ কত সুন্দর করে গড় দেখানো হয়েছে। আরও খেয়াল করলে দেখবেন, প্রথম দুই কলামের গড়ের জায়গায় NA লেখা। এর কারণ na.rm = TRUE দেওয়া হয়নি। দিয়ে দিন:

       

    এখানে আমরা TRUE কে সংক্ষেপে T লিখেছি। এভাবে লিখলেও চলে, তবে আদর্শ কোডিং হলো না আর কি। 

     শুধু কি গড়? একইভাবে আমরা সব কলাম বা সারির অন্য কোনো তথ্যও বের করতে পারব। শুধু এতে ফাংশনটার নাম দিয়ে দিতে হবে। যেমন মধ্যমা বা পরিমিত ব্যবধান (standard deviation) বের করতে হলে:


    এখন, মজার ব্যাপার হলো গড় বের করতে চাইলে এতটুকুও কষ্ট করার দরকার নেই আসলে। কল্পনাও করতে পারবেন না, এর চেয়েও সহজ একটি কোডও আছে। কলামের গড় বের করতে চাইলে:

      

    একইভাবে সারির গড় বের করতে চাইলে ফাংশনটা হবে rowMeans()। 

    আপাতত আর কোনো কৌশল দেখব না। তার চেয়ে একটা সমস্যার সমাধান করি। আমরা উপরে যে উদাহরণ দেখলাম, এখানে সবগুলো কলাম ছিল সংখ্যাসূচক। নিউমেরিক বা ইন্টিজার। যদি এক বা একাধিক character ভেক্টর থাকে? যেমন ধরুন আমরা যদি mpg ডেটা দিয়ে এই কাজ করতে যাই তাহলে কী হয় দেখুন:

     

    error দেখাবে। তাহলে সমাধান হলো সংখ্যাবাচক কলামগুলোকে আলাদা করে নিতে হবে।

     

    অথবা ব্যবহার করতে পারেন tidyverse প্যাকেজমালা থেকে dplyr এর ফাংশনটা।

     

    এসব উপায়ে গড় বের করার আরেকটা সুবিধাও আছে। গ্রাফ আঁকতে চাইলেও ডেটা প্রস্তুত হয়েই আছে। যেমন ধরুন, আমরা যদি airquality ডেটার গড়গুলো বারপ্লটে দেখাতে চাই। 



    ডেটাফ্রেইমের কলাম ইনফরমেশন থেকে সহজ বারপ্লট

    ☛ প্লট আঁকার কলাকৌশল দেখতে দেখুন এই লিঙ্কটি। 

    ব্যস! হ্যাপি প্রোগ্রামিং !!!
    Category: articles

    Thursday, October 1, 2020

     

    চেনাজানা সংখ্যাগুলোর সূচকের নিয়ম তো আমরা জানি। $3^2$ এর অর্থ হলো $3 \times 3$। মানে ৩ কে নিজের সাথে দুইবার গুণ করা। কিন্তু কাল্পনিক সংখ্যা  $i^i$ এর মানে কী? এর মানই বা কী হবে? কেন হবে? সেটার অর্থ কী? 

     

    জটিল জিনিসকে সহজ করে চিন্তা করি।  $i^i$কে $1 \cdot i^i$ চিন্তা করি। মানে আমরা ১ থেকে $i^i$ সংখ্যাটিতে যাব। আর ভাবব সেটার মানে আসলে কী। 


    আগেই বলেছি, ১ যেকোনো গুণের মৌলিক অংশ। ১-কে বলা হয় গুণজ অভেদ। যেভাবে যোগ-বিয়োগের মৌলিক অংশ শূন্য। যোগ-বিয়োগ করে কিছু না থাকলে থাকে শূন্য। গুণ (ও ভাগে) কাটাকাটি করে কিছু নেই মানে ১ আছে। যেমন, ৩কে ২ দিয়ে গুণ করা মানে আসলে ১কে ৬ দিয়ে গুণ করা। গুণ মানে আসলে ১কে ফুলিয়ে দেওয়া।

     

     সংখ্যাকে একটু ভিন্নভাবে চিন্তা করতে শুরু করি। ধরুন একটি গ্রামে ৩০০ জন শিক্ষিত মানুষ আছেন। এখন আপনি চাইলেই এই ৩০০ সংখ্যাকে ভিন্নভাবে চিন্তা করতে পারেন। শুরু করি ১ থেকে। শুরুতে গ্রামে একজন শিক্ষিত মানুষ ছিলেন। তিনি এবং ক্রমেই তার ছাত্ররা বাকিদের শিক্ষিত করেছেন। 

     

    যেহেতু বৃদ্ধির (growth) কথা চলে এল, তাই কাজে আসবে আসবে সূচকীয় ফাংশন। বৃদ্ধির সাথে সূচকীয় ফাংশনের সম্পর্ক নিয়ে কিঞ্চিত (তবে এ লেখার জন্যে যথেষ্ট) আলোচনা আছে এখানে। সূচকীয় বৃদ্ধিটা মূলত ব্যবহার করা হয় অবিরাম বা প্রতি মুহূর্তেবৃদ্ধি পাওয়া জিনিসের ক্ষেত্রে। 


     সূচকীয় ফাংশনের ব্যবহারটা দেখে নেই। সূত্রটা এ রকম: $P=P_oe^{rt}$

     

    এখানে 

     

    P =বৃদ্ধির পরে যা হবে। আমাদের উদাহরণে এটা ৩০০। 


    $P_o$= শুরুতে যা ছিল। এটা আমাদের উদাহরণে ১। কারণ আমরা ধরে নিয়েছি ১ জন শিক্ষিত মানুষ আছেন। 


    e = অয়লার সংখ্যা (২.৭১৮...)। এখানে এটা নিয়েও আলোচনা আছে। 


    r = বৃদ্ধির হার 


    t = $P_o$ থেকে $P$ হতে যতটুকু সময় লাগবে। 

     

    সূত্রে মানগুলো বসালে আমরা পাই, 

     

    $300=1 \cdot e^{rt}$

     

    বা $\ln(300)=rt$

     

    বোঝার সুবিধার্থে সময়কে এক একক (যেমন এক মাস) ধরে নিলে এই কথার অর্থ হয়: $\ln(300)$ হারে ১ জন শিক্ষিত মানুষ গ্রামের সবাইকে অবিরাম পড়াতে থাকলে এক মাসেই ৩০০ জন মানুষ শিক্ষিত হয়ে যাবেন। $\ln(300)$ এর মান ৫.৭০২ দেখে ভাববেন না, কীভাবে এটা সম্ভব? মনে রাখতে হবে, তিনি একজনকে শিক্ষিত করা মাত্রই সেই শিক্ষিত মানুষ আরেকজনকে, তিনি আরেকজনকে, ... এভাবে শিক্ষাদান এগিয়ে যেতে থাকবে। 

     

    তার মানে, সহজ কথা হলো, ৩০০ মানে আমরা বুঝব, $\ln(300)$ হারে অবিরাম কিছু একটা বৃদ্ধি পেতে থাকলে চূড়ান্ত মান হবে ৩০০। একইভাবে $\ln(5)$ হারে একইভাবে বৃদ্ধি পেলে মান হবে ৫। এটাই হলো সংখ্যাকে অন্য আরেকভাবে চিন্তা করা। সবসময় হয়ত আপনি ৩, ৫ কে এভাবে সূচকীয় বৃদ্ধির মাধ্যমে পাবেন না। তবে এটাও কিন্তু সংখ্যাকে অনুভব করার আরেকটি উপায়। 


    দেখা যাক, এই অনুভব দিয়ে কাল্পনিক সংখ্যাকে বোঝা যায় কি না। প্রথমে ১ থেকে i তে যাওয়া যাক। এজন্যে আমাদেরকে ৯০ ডিগ্রি বাঁয়ে ঘুরতে হবে। মানে X অক্ষ থেকে ঘড়ির কাঁটার উল্টো দিকে ঘুরে Y অক্ষে যেতে হবে। কারণ i এর অবস্থান ১ একক সমান দৈর্ঘ্যের Y অক্ষে। 

     


    তাহলে ১ থেকে iতে যেতে হলে আমাদেরকে $\frac {\pi} 2$ পরিমাণ বা ৯০ ডিগ্রি ঘুরতে হবে। তাহলে আমাদের বৃদ্ধির হার হবে $i \cdot \frac{\pi}{2}$। 

     

    বৃদ্ধির ফর্মুলাটা হলো, $e^{rt}$। আমাদেরকে এই ফর্মুলা দিয়ে $i$ অবস্থানে যেতে হবে। তাহলে ১ থেকে ১ একক সময়ে i অবস্থানে যেতে হলে আমাদেরকে ঐ সময়ে ৯০ ডিগ্রি ($\frac{\pi}{2}$ রেডিয়ান) ঘুরতে হবে। অতএব, ১ থেকে $i$ পেতে আমরা এই সূত্র ব্যবহার করতে পারি 

      

    $i=e^{i \frac{\pi}{2}}$

     

    একে আরেকভাবেও চিন্তা করা যায়। ১ থেকে (-১) এ যেতে আমরা ১৮০ ডিগ্রি ঘুরি। আর সেটাকে অয়লারের অভেদ দিয়ে প্রকাশ করি $e^{i \pi}$ দিয়ে। তাহলে ১৮০ এর অর্ধেকটা মানে ৯০ ডিগ্রি বা $i$ অবস্থানে যেতে ফর্মুলাটা হবে $e^{i \frac{\pi}{2}}$। 


    এ তো গেল i। কিন্তু i এর পাওয়ারও তো i। সেটার কী হবে? এটা বলছে আমাদেরকে $i \frac{\pi}{2}$ হারের বদলে  $i \frac{\pi}{2} \cdot i$ হারে বৃদ্ধি করতে হবে। ঠিক যেমন $3^4$ মানে আমাদেরকে $\ln(3)$ হারে বৃদ্ধি করে তার আবার চারগুণ যেতে হবে। মানে নতুন হার হয়েছিল $\ln(3) \times 4$।

     

    তার মানে বৃদ্ধির হার হবে $i \frac{\pi}{2} \cdot i = \frac{\pi}{2} \cdot -1 = - \frac{\pi}{2}$ 

     

     কারণ, আমরা জানি, $i \cdot i $ বা $i^2$ এর মান (-1)। 


     আমাদের বৃদ্ধির হারটা বাস্তব সংখ্যা হয়ে গেল!  কিন্তু নেগেটিভ। এর মানে আসলে বৃদ্ধির বদলে হ্রাস ঘটবে। তার মানে, আমরা শুরু করেছিলাম ১ থেকে। আর এখন যাকে পাব সে হবে ১ এর চেয়ে ছোট। দেখা যাক, সেটা কী? 

    0.2078796

    আপনি কম্পিউটারের $i^i$ বা $e^{- \frac{\pi}{2}}$ যেটাই দিন, উপরের মানটাই আসবে। যেমন R প্রোগ্রামিং দিয়ে করলে
     
      
     
    তাহলে দেখতে অদ্ভুত হলেও কাল্পনিক সংখ্যার ভিত্তি ও সূচক মিলেও পাওয়া গেল বাস্তব সংখ্যা! 
     

    i এর মান যে $e^{i \cdot \frac{\pi}{2}}$ সেটা আমরা অয়লারের ফর্মুলা থেকেও বের করতে পারি। আমরা জানি, $e^{ix}=cos(x)+isin(x)$। এখন, এখানে x এর জায়গায় $\frac{\pi}{2}$ বসালে হয়
     
     
    $e^{i \frac{\pi}{2}}=cos(\frac{\pi}{2})+isin(\frac{\pi}{2})=0+i \cdot 1=i$
     
    সূত্র 
     
    আরও পড়ুন 
    Category: articles

    Sunday, September 27, 2020

    আমরা জানি, $e^{iπ}=-1$। কিন্তু কেন? যারা গণিতকে শুধু বইয়ের অক্ষরের মধ্যেই সীমিত মনে করেন, তাদের মতে এই সূত্রের কোন বাস্তব তাৎপর্য নেই। এটা নিছক সূত্রের মারপ্যাঁচে ঘটে গেছে।

    ঠিক যেমনটা বলেছিলেন, আঠারশ শতকের গণিতবিদ বেঞ্জামিন পিয়ার্স
     
    সূত্রটা স্বাভাবিক বুদ্ধির সম্পূর্ণ বিপরীত। একে আমরা না বুঝতে পারি, আর না জানি এটা কী বোঝায়। তবে যেহেতু এর প্রমাণ আছে, তা বাধ্য হয়ে একে মানতে হচ্ছে। 
     
    কিন্তু গণিতের সব সূত্রেরই বাস্তব ও মজার তাৎপর্য থাকে। আছে অদ্ভুতদর্শন এই সূত্রেরও। সূত্রটি গণিতের অনেকগুলো শাখাকে একত্রিত করেছে। e এর আবির্ভাব ক্যালকুলাস থেকে, π আসে জ্যামিতি থেকে, i এর পদচারণা জটিল সংখ্যার জগতে। আর ০ ও ১ এর ব্যবহার পাটিগণিতে। 
     

    লিওনার্দ অয়লার ছিলেন সুইস গণিত ও পদার্থবিদ। অবদান রেখেন জ্যোতির্বিদ্যা, ভূগোল, যুক্তিবিদ্যা ও প্রকৌশলেও। গ্রাফ থিওরি ও টপোলজির সূচনা তাঁর হাত ধরেই।

     
    ১-কে বলা হয় গুণজ অভেদ। যেকোনো গুণের মৌলিক অংশ ১। যেভাবে যোগ-বিয়োগের মৌলিক অংশ শূন্য। যোগ-বিয়োগ করে কিছু না থাকলে থাকে শূন্য। গুণ (ও ভাগে) কাটাকাটি করে কিছু নেই মানে ১ আছে। যেমন, ৩কে ২ দিয়ে গুণ করা মানে আসলে ১কে ৬ দিয়ে গুণ করা। গুণ মানে আসলে ১কে ফুলিয়ে দেওয়া।
     
    অন্য গুণের মতোই ধরুন আমরা ১ থেকে শুরু করছি। তারপর একে $e^{iπ}$ দিয়ে গুণ দিচ্ছি। 
     
    e দ্বারা বোঝায় সূচকীয় বৃদ্ধি। এক কথায় এর অর্থ হলো ১কে কোনো একটি হারে নির্দিষ্ট সময় ধরে বাড়াতে থাকা। সূচকীয় বৃদ্ধি আসলে জ্যামিতিক বৃদ্ধিরই অন্য একটি রূপ, যেখানে নির্দিষ্ট সময় পরপর বৃদ্ধির বদলে বৃদ্ধি ঘটে প্রতি মুহূর্তে। 
     
    এখানে e এর পাওয়ার হিসেবে আছে i, যা কাল্পনিক সংখ্যার প্রতীক। নামে কাল্পনিক হলেও সংখ্যাটা বাস্তব সংখ্যার চেয়ে কোনো অংশে কম বাস্তব নয়। এখানে e এর উপর i দিয়ে বোঝাচ্ছে আমাদের সূচকীয় বৃদ্ধিটা রৈখিক হবে না। হবে বৃত্তাকার। একটি বৃত্তকে বেয়ে ঘড়ির কাঁটার উল্টো দিকে ঘুরে আসার মতো। উল্টো দিকে কেন? কারণ ত্রিকোণমিতিকে বৃত্তাকার চলনকে এভাবেই সংজ্ঞায়িত করা হয়েছে। 
     
    এখন কতটুকু চলব? সেটা বলে দিচ্ছে পাই (π)। মানে আমরা পাই রেডিয়ান বা ১৮০ ডিগ্রি ঘুরব।
    এখন এটা জানা কথা সংখ্যারেখায় ১ আর (-১) থাকে ১৮০ ডিগ্রি উল্টো দিকে। কত দারুণ ফর্মুলাটা! 
     

    এ কারণেই আমরা ১ থেকে শুরু করে (-১) এ গিয়ে থেমেছি। 
     
    আরও পড়ুন 
    Category: articles

    Tuesday, September 8, 2020

    অনলাইন ক্লাসের জন্য প্রতিদিন প্রেজেন্টেশন স্লাইড বানাতে হয়। MS পাওয়ারপয়েন্ট স্লাইডকে বিদায় জানিয়েছি এক বছর আগে। এখন স্লাইড বানাই কোড লিখে লিখে। ব্যবহার করি এক গাদা ল্যাংগুয়েজ। অন্তত সাতখানা। R, Markdown, Javascript, HTML, CSS, Tex (Latex) ও bash। প্রতিটা ল্যাংগুয়েজই অসাধারণ। মিলেমিশে টিমওয়ার্ক করে আমার মনের মতো স্লাইড বানিয়ে দেয়।

     


    তা কোনটা কেন ইউজ করি?
    R: বহুমুখী কাজের জন্য। প্রথমত Rstudio এর মাধ্যমে স্লাইড ফাইলগুলো এর মধ্যেই তৈরি করি। তবে R এর মূল অবদান আরও বড়। আমার স্লাইডে মাঝেমধ্যেই গ্রাফ বা টেবিল ও সেগুলোর হিসাব-নিকাশ থাকে। এই কাজগুলো R অটো করে দেয়। প্লট বা গ্রাফ এঁকে সেটাকে পিসিতে সেভ করে তারপর ইনসার্ট করার কোনো ঝামেলা নেই। ডেটা আর কোড লিখে দেব। গ্রাফ বা রেজাল্ট অটো চলে আসবে। ইডিট করা অনেক flexible। কোনো ভুল হলে নতুন করে গ্রাফ বানিয়ে আবারও ইনসার্ট করা- সেই দিন এখন অতীত।
     
    Markdown মূলত R এ তৈরি ফাইলকে সুন্দর করে পাবলিশ করে দেয়।
    এটাকে MS Word এর বিকল্প ভাবতে পারেন। Rstudio তে .Rmd ফাইলগুলোই R এর মধ্যে Markdown implement করিয়ে দেয়।
    সাথে revealjs প্লাগইন ফাইলটাকে সুন্দর স্লাইড আকারে পাবলিশ করতে হেল্প করে। revealjs আবার Javascript দিয়ে করা। js হলো Javascript এর abbreviation।
     
    CSS: স্লাইডের ওভারঅল থিম নির্ভর করে সরল এই ল্যাঙ্গুয়েজটার ওপর। styles.css নামে ফাইলটা প্রোজেক্ট ফোল্ডারে রেখে দিলেই কেল্লা ফতে!
     
    আর HTML ছাড়া তো css ও js ইমপ্লিমেন্ট করা যাবে না। তাই তাকেও রাখতে হলো। বিশেষ করে দুই বা বহু কলামের কন্টেন্ট জাভাস্ক্রিপ্ট দিয়ে বানাতে গেলে HTMLও লাগে। আবার ক্লিক করলে দেখা যাবে এমন js script এর জন্য দরকার html।
     
    Javascript এর ব্যবহার অলরেডি বলাই হয়ে গেছে। revealjs প্লাগইন দিয়ে Rmd ফাইলকে স্লাইড আকারে পাবলিশ করতে শুরুতেই js লাগছে। R এর মধ্যে এটা আছে revealjs package হিসেবে। আরও বেশ কিছু কাজে দারুণ পাওয়ারপুল js ভাষাটা ইউজ করা হয়, যার কিছু উদাহরণ অলরেডি বলেছি।
     
    Tex (উচ্চারণ টেক) এর প্রশংসা তো করে শেষ করাই যাবে না। গণিতের যত কঠিন সমীকরণই দেবেন Tex সেটা পাব্লিশ করে দেবেই। Tex এর জনপ্রিয় implementation লেটেক (Latex) ইউজ করি এ কাজের জন্য।
     
    bash মূলত একটি লিনাক্স শেল বা কমান্ড লাইন। এটা ইউজ করি মূলত Git ও Github এর জন্য। কাজ করা ফাইলগুলো নিয়মিত ট্র্যাক করি এর মাধ্যমে। একে বলা হয় ভার্সন কন্ট্রোল। এর প্রয়োজন ২/১ কথায় বলা সম্ভব নয়।
     
    এতগুলো ল্যাংগুয়েজ ভালোই টিমওয়ার্ক করে যাচ্ছে। কোড করে কাজ করায় মজাই আলাদা ❤
    কোড দেখতে চাইলে এখানটায় ঘুরে আসুন
    Category: articles

    Friday, August 21, 2020

     টেক্সট অ্যানালাইসিস আমার খুব প্রিয় জিনিস। প্রিয় ওএস লিনাক্সে আসার পর কাজটা আরও অনেক সহজ হয়ে গেছে। কীভাবে হলো একটু দেখাই যাক। 

     

     

    ধরুন আমাদের কাছে কিছু টেক্সট আছে। এর কিছু শব্দকে অন্য কিছু দিয়ে পাল্টে দিতে চাই। 




    এই কোড hello শব্দের h-কে t দিয়ে বদলে দেবে। শুরুতেই s দিয়ে বলা হচ্ছে, বদলে দাও। ইংরেজিতে substitution আরকি।

    এখানে আমরা যে টেক্সট নিয়ে কাজ করব সেটাকে আগে echo দিয়ে প্রিন্ট করে নিয়েছি। কিন্তু বাস্তবে আমাদেরকে ফাইন্ড ও রিপ্লেসের এই কাজখানি করতে হবে ফাইল দিয়ে। সে কাজটাও পানির মতোই সোজা। ধরুন আমাদের কাছে file নামে একটি ফাইল আছে। চাইলে আপনি এক্সটেনশনসহ ফাইল নিতে পারেন। যেমন file.txt। তাতে কোনোই অসুবিধা হবে না। ধরা যাক file ফাইলটিতে এই তথ্যগুলো আছে।



    এবার ধরুন, আমরা এখান থেকে প্রথম line শব্দটাকে statement শব্দ দিয়ে বদলে দিতে চাই।



    তবে ফাইলের সবগুলো কাঙ্ক্ষিত শব্দকে চেঞ্জ করা নিশ্চিত করতে চাইলে "g" অংশ যোগ করতে হবে। মানে এ রকম:



    এটা কেন দরকার দেখতে হলে নীচের দুই লাইন কোড রান করে দেখুন। দেখবেন দুটো থেকে দুরকম আউটপুট মিলবে।  


      

     

    তবে এখানে যে আউটপুট প্রিন্ট হচ্ছে সেটা কিন্তু এখানেই শেষ। সেভ কিন্তু হচ্ছে না। শেভ করতে হলে ">" বা ">>" দিয়ে সেভ করে নিতে হবে। মনে রাখতে হবে > দিলে কিন্তু ফাইলে আগের কিছু থাকবে না। 
     

     

     

    এ তো গেল শুধু একটা একটা অংশ রিপ্লেস করতে চাইলে। আপনি চাইলে অনেকগুলো অংশকে অনেকগুলো আলাদা আলাদা শব্দ দিয়েও রিপ্লেস করতে পারেন। এক্ষেত্রে প্রতিটি অংশের আগে "-e" দিতে হবে। 

     

    Category: articles

    Wednesday, August 12, 2020

    দিন দিন R-এ ম্যাপ আঁকা সহজ থেকে সহজতর হচ্ছে। একটু চেষ্টা করেই কোভিড-১৯ মহামারীর চিত্র ওয়ার্ল্ড ও বাংলাদেশের ম্যাপে দেখিয়ে ফেলতে পেরেছি। কীভাবে এত কঠিন কাজ সহজ হলো সেটা বলতেই আজকের লেখা।

    বাংলাদেশের কোভিড-১৯ মহামারীর প্রকোপ 
    আগে অবশ্যই দরকারি প্যাকেজগুলো লোড করে নিতে হবে।



    এখন প্রশ্ন হলো ম্যাপ আঁকার ডেটা পাব কোথায়? একটুও চিন্তা করবেন না। এসব ডেটা অনেক মহামানুষ কষ্ট করে বানিয়ে রেখেছেন। আপনাকে শুধু খুঁজে নিয়ে ব্যবহার করতে হবে এই যা। ম্যাপ আঁকার জন্য প্রয়োজনীয় শেইপফাইল পাবেন এখানে

    ডাউনলোড করে নিয়ে আনজিপ করে নিন। এবার কী করবেন সেটা এই লেখায় আগেই বলা হয়েছে

    লেখাটির plot(zilla, col="green") কোড পর্যন্ত অন্তত অনুশীলন করে আসুন।

    এসেছেন তো? এবার সামনে যাওয়া যাক।

    আমরা এবারে ম্যাপ আঁকব ggplot2 দিয়ে। ggplot2 সব অবজেক্টকে ডেটাফ্রেইম হিসেবে দেখতে চায়। তাই শেইপফাইলকে ডেটাফ্রেইম বানিয়ে নিতে হবে। কিন্তু সেটা এমনভাবে করতে হবে যেন ম্যাপের সবকিছু আবার উলটপালট হয়ে না যায়। সেজন্য ব্যবহার করতে হবে fortify ফাংশন।



    এবার আরেকটি বড় কাজ বাকি। করোনার তথ্য এই ডেটাফ্রেইমে নিয়ে আসতে হবে। সেটা আমরা করব। তার আগে আপনি একটু দেখে নিন zilla_gg ডেটাফ্রেইমে কী আছে। এই কোড রান করতে হলে Rstudio লাগবেই আপনার।



    কলামগুলো দেখে নিন একবার। ও আচ্ছা, তার আগে শুধু zilla অবজেক্টটাও দেখে নিন। খেয়াল করলে দেখবেন NAME_2 কলামে দেশের জেলাগুলোর নাম আছে। তবে fortify করার পর এতকিছু নেই। ম্যাপের তথ্য এখানে long, lat নামে দ্রাঘিমা ও অক্ষাংশ হিসেবে সংরক্ষিত আছে। zilla_ggতে id নামে একটি কলাম আছে। একটু মিলিয়ে দেখলে বুঝবেন এটা আসলে ৬৪ জেলার জন্য ইউনিক আইডি। শুরু ০ থেকে আর শেষ ৬৩-তে। এখন এই আইডির বিপরীতে আমাদের করোনার তথ্য বসিয়ে নিলেই আমাদের ডেটা প্রস্তুত।

    কাজটি একটু বিরক্তিকর। সেটাকে সহজ করার জন্যে আমি সবসময় একটি csv ফাইল রেডি রাখি। আপনি চাইলে এখান থেকে ফাইলটি ডাউনলোড করে নিতে পারেন। corona নামে এখানে একটি কলাম আছে। এই কলামটি আপডেট তথ্য দিয়ে পূর্ণ করা আপনার দায়িত্ব। এখন কাজ হলো এই তথ্যকে zilla_gg ডেটাফ্রেইমে নিয়ে আসা।

    সেটা করার জন্যে আমরা ব্যবহার করব dplyr প্যাকেজের left_join ফাংশন। এই ফাংশনগুলো কীভাবে কাজ করে দেখতে হলে এখানটায় ঢুঁ মেরে আসুন। ও, তার আগে csv ফাইলটা পড়ে নিই। আরেকটি কাজ করা লাগবে। zilla_gg এর id কলামটা character হয়ে আছে। কিন্তু আমাদের csv ফাইলে id কলাম হলো numeric। তাই zilla_gg কে numeric করে নিতে হবে।
    তারপর জয়েন করে ফেলি।



    এবার শুধুই আঁকা।



    আপাতত আমরা এটা পেলাম।

    কিন্তু নিজের ইচ্ছেমতো রং দেওয়া না গেলে কি আর মনে শান্তি পাওয়া যায়? এজন্যে RColorBrewer প্যাকেজ দারুণ উপকার করে। তবে এখানে আমরা সেটা ছাড়াই রং করে ফেলব। আগের কোডের পরে "+" চিহ্ন দিয়ে এটা যুক্ত করে দিন।



    এবারে কিন্তু আমরা উপরে দেখানো ম্যাপই পেয়ে গেলাম। এখানে যেহেতু আমরা মৃত্যু দেখাচ্ছি, তাই লাল থেকে হলুদ রংয়ের দিকে গিয়েছি। অন্য ক্ষেত্রে অন্য কালার কম্বিনেশন ব্যবহার করাই ভাল। আরও বেশি কালার কম্বিনেশনের জন্যে আমি এই লিংকটা কাজে লাগাই। আপনিও লাগাতে পারেন।

    আরও পড়ুন:  
    ☛ R প্রোগ্রামিং: প্লট কালারিং এর ৯ উপায়

    মূল কাজ তো শেষ। এখন আরও কিছু ফাইন-টিউনিং করে নিলে মন্দ কী!

    Category: articles

    Sunday, May 17, 2020

    লিনাক্সের গুণের কথা তো বলে শেষ করা যায় না। আজ দেখব কীভাবে খুব সহজ হিসাব-নিকাশ করবেন। ভণিতা না করে দেখে ফেলি।



    আগে চলুন ১০ আর ১১ যোগ করি।




    একইভাবে বিয়োগ



    এখানে expr আসলে expression বা গাণিতিক পদ বোঝায়।

    তবে গুণ সোজাসুজি কাজ করবে না। এই কোডটা দিয়েই দেখুন না।



    দিতে হবে এভাবে



    তবে ভাগ কাজ করবে ফরোয়ার্ড স্ল্যাশ দিয়েই।



    তবে পরের এক্সপ্রেশনটার আউটপুট দেখলে খেয়াল করবেন, ফল এসেছে পূর্ণ সংখ্যায়। আসলে সহজ এই টুলটি ভগ্নাংশ নিয়ে কাজ করতে পারে না।

    সেজন্যে আপনার লাগবে bc টুল। কমান্ড লাইনে হিসাব-নিকাশের জন্যে এটা অন্যতম সেরা একটি টুল। দারুণ ব্যাপার হলো এখানে আপনি ভগ্নাংশ নিয়েও কাজ করতে পারেন। এখানে echo দিয়ে expression লিখে পাইপ অপারেটর দিয়ে তাকে bc টুলের মধ্যে দিয়ে দিতে হবে পাইপ অপারেটর ("|") দিয়ে।



    আরও পড়ুন
    লিনাক্স কমান্ড লাইন: হাতে খড়ি

    চাইলে কত ঘর পর্যন্ত দশমিক চান সেটা বলে দিতে পারবেন। এজন্য scale বলে দিতে হবে।



    বুঝতেই পারছেন, scale এর পজিশন যেকোনো জায়গায় হতে পারে।

    bc নিয়ে বিস্তারিত গল্প অন্য সময় করব ইনশাআল্লাহ।

    একটি সংখ্যার উৎপাদক বের করাও কমান্ড লাইনে এক শব্দের খেল।



    মনে করুন, এক সারি নাম্বার চাই আপনার। তাও জেনারেট করতে পারবেন সহজে। ধরুন আমরা ৫ টি সংখ্যা জেনারেট করব যারা শুরু হবে ১০১ দিয়ে।



    আরেকটু কাজের কাজ করি। ধরুন আমাদের May1, May2, May3 ইত্যাদি এক সারি আউটপুট লাগবে। বারবার এটা না লিখে এটা আমরা jot দিয়ে বানিয়ে নিতে পারি। হ্যাঁ, এখানে আমাদের bash loop কমান্ড লাগবে।

    আরও পড়ুন
    লিনাক্স কমান্ড লাইন: সহজ লুপ



    চাইলে এই আউটপুট একটি ফাইলেও সেভও করে নিতে পারেন।



    সবশেষে jot কমান্ডের আরেকটা কারিশমা দেখব। পরিসংখ্যানে আমাদেরকে প্রায়ই দৈব সংখ্যা (random number) নিয়ে কাজ করতে হয়। দেখুন jot দিয়ে কত সহজে কাজটা করা যায়। নীচের কোডে প্রথম ১০ দিয়ে বলছি আমরা ১০টি সংখ্যা চাই। পরের দুটি সংখ্যা দিয়ে রেঞ্জ বোঝানো হলো। অর্থাৎ, সংখ্যাগুলো হবে ১০ ও ১০০ এর মধ্যে।



    একই কোড দুইবার দিলাম দেখানো জন্যে যে দুইবার আসবে আলাদা আলাদা আউটপুট। র‍্যান্ডম নাম্বার বলে কথা!

    এখন যা করব সেটা নিছক মজা পাওয়ার জন্যে। আপনি চাইলে পালাতে পারেন এখান থেকে। অবশ্য শিখি তো মজা পাবার জন্যেই।

    আমরা দেখব ১ থেকে ৫ পর্যন্ত সংখ্যাগুলো থেকে দৈবভাবে ১,০০০ টা সংখ্যা নিলে কয়টা সংখ্যা কয়বার আসে।



    সূত্র
    ১। নেটওয়ার্ক ওয়ার্ল্ড
    Category: articles