StoryCode

유전 알고리즘(Genetic Algorithm)(3)-MST(java)

유전 알고리즘
반응형

오늘은 저가 짠 유전 알고리즘 설명 해드리겠습니다.

저가 글을 잘 못써 큰 부분으로 큼지막하게 설명하겠습니다.

 

먼저 유전알고리즘이 진행 되면서 변경되는 염색체 클레스입니다.



//염색체 클레스이다.
private class chromosome implements Comparable<chromosome>{
    int order[] = null;
    int fit=0;
    int useFit=0;
    chromosome(int ch_len){
        order = new int[ch_len];
    }
    public int compareTo(chromosome ch) {
        return ch.useFit-this.useFit;  // 자기 자신이 기준이 되면 오름차순
    }                                   //상대가 기준이면 내림차순 feat.sort
    public boolean isExist(int data, int currentAt){
        for(int i=0;i<ch_len;i++){
            if(i!=currentAt){
                if (order[i]==data)
                    return true;
            }
        }
        return false;
    }
}



염색체의 생성자에는 염색체의 길이를 받아 올 수 있도록 만들었습니다.

 

다음은 메인 클레스인 GA의 생성자 입니다.



private int[][] dataMatrix;
    private int ch_len, FG_Num, limitSolution, thresholds_fit, eliteNum, newGenerNum;
    private chromosome[] generationPool;
    private chromosome[] elite_Chs;
    private chromosome bestSolution = null;
     
    //데이터 + 염색체 길이 + 염색체 갯수 + 목적치 + th_fit + 엘리트수 + 교배횟수
    GA(int[][] m_dataMatrix, int m_ch_len, int m_FG_Num, int m_limitSolution,
            int m_thresholds_fit, int m_eliteNum, int m_newGenerNum){
        this.dataMatrix = m_dataMatrix;
        this.ch_len = m_ch_len;
        this.FG_Num = m_FG_Num;
        this.limitSolution = m_limitSolution;
        this.thresholds_fit = m_thresholds_fit;
        this.eliteNum = m_eliteNum;
        this.newGenerNum = m_newGenerNum;
         
        generationPool = new chromosome[FG_Num];
        elite_Chs = new chromosome[eliteNum];
        for(int i=0; i<FG_Num;i++){
            generationPool[i] = new chromosome(ch_len);
            setFirst_G(generationPool[i]);
            calFit(generationPool[i]);
        }
        elite_Chs = setElite(generationPool);
        G_printf(generationPool,elite_Chs);//1세대 출력
        for(int i=0; i<newGenerNum;i++){
            generationPool = nextG(generationPool, elite_Chs);
            elite_Chs = setElite(generationPool);
            G_printf(generationPool,elite_Chs); //각 세대 확인
            if(elite_Chs[0].fit < limitSolution){//작은게 좋은거
                bestSolution = elite_Chs[0];
                break;
            }
//          if(elite_Chs[0].useFit > limitSolution)//큰게 좋은거
//              bestSolution = elite_Chs[0];
//              break;
        }
        bestSolution = elite_Chs[0];
    }



제가 구성한 GA 코드는 생성자에서 모든 계산을 끝냅니다.

생성자를 보시면

generationPool = new chromosome[FG_Num];
  elite_Chs = new chromosome[eliteNum];

대표적인 변수인 한 세대의 염색체가 모두 있는 염색체 배열과 엘리트 염색체가 들어가는 염색체 배열입니다.

코드는 크게 2부분으로 보시면 됩니다. 1세대를 초기화 하는 부분과 그 외 세대를 생성하고 fit를 계산하는 부분입니다.

for(int i=0; i<FG_Num;i++){
   generationPool[i] = new chromosome(ch_len);
   setFirst_G(generationPool[i]);
   calFit(generationPool[i]);
  }
  elite_Chs = setElite(generationPool);

첫 번째 for문에서 1세대를 생성 및 초기화를 합니다. 그리고 생성이 끝나면 그 중에서 Fit가 가장 큰 엘리트를 선별합니다.

다음 for문에서는 nextG 함수로 하여 생성되어 있는

generationPool배열과 elite_Chs 배열을 변경합니다.

이때 생성자 파라메터로 받은 최대 세대나 목적치의 값이 나오면 멈춥니다.

 

다음은 다음 세대를 구하는 NextG함수 입니다.



private chromosome[] nextG(chromosome[] generationPool, chromosome[] elite_Chs){
    chromosome[] newGeneration = new chromosome[FG_Num];
    int s_ch1=-1, s_ch2=-1;
    int allArea = 0;
    int area[] = new int [FG_Num];
     
    for(int i=0;i<FG_Num;i++)
        allArea+=generationPool[i].useFit;
    for(int i=1;i<FG_Num;i++){
        area[i]=(int)((float)generationPool[i].useFit/allArea*1000);
        area[i]+=area[i-1];
    }
    for(int i=0;i<eliteNum;i++)
        newGeneration[i] = elite_Chs[i];
    for(int i=eliteNum;i<FG_Num;i++){
        s_ch1=-1;
        s_ch2=-1;
        while(s_ch1 == s_ch2){
            s_ch1 = ch_Select(area);
            s_ch2 = ch_Select(area);
        }
        //System.out.println("ch1 : "+s_ch1+" ch2 : "+s_ch2);
        newGeneration[i] = crossover(generationPool[s_ch1],generationPool[s_ch2]);
        mutation(newGeneration[i]);
        calFit(newGeneration[i]);
    }
    return newGeneration;
}



NextG 함수는 먼저 이전 세대의 엘리트 염색체를 가져옵니다. 그리고 남은 갯수의 염색체는 2개의 이전 세대의 염색체를 반반 합쳐서 새로운 염색체를 합칩니다. (중복된건 당연히 처리 해야겠죠)

그리고 일정 확률로 염색체에 대해서가 아닌 각각의 세포에 대해 돌연변이를 발생시킵니다. 돌연변이에 대한 정의는 GA알고리즘의 성능에 영향을 끼치는데 저는 특정 세포에서 돌연변이가 발생하면 남은 세포와 자리를 바꾸는 식으로 구현했습니다.

 

아래는 풀코드입니다.



import java.util.Arrays;
 
import java.util.Arrays;
 
public class GA {
    private int[][] dataMatrix;
    private int ch_len, FG_Num, limitSolution, thresholds_fit, eliteNum, newGenerNum;
    private chromosome[] generationPool;
    private chromosome[] elite_Chs;
    private chromosome bestSolution = null;
     
    //데이터 + 염색체 길이 + 염색체 갯수 + 목적치 + th_fit + 엘리트수 + 교배횟수
    GA(int[][] m_dataMatrix, int m_ch_len, int m_FG_Num, int m_limitSolution,
            int m_thresholds_fit, int m_eliteNum, int m_newGenerNum){
        this.dataMatrix = m_dataMatrix;
        this.ch_len = m_ch_len;
        this.FG_Num = m_FG_Num;
        this.limitSolution = m_limitSolution;
        this.thresholds_fit = m_thresholds_fit;
        this.eliteNum = m_eliteNum;
        this.newGenerNum = m_newGenerNum;
         
        generationPool = new chromosome[FG_Num];
        elite_Chs = new chromosome[eliteNum];
        for(int i=0; i<FG_Num;i++){
            generationPool[i] = new chromosome(ch_len);
            setFirst_G(generationPool[i]);
            calFit(generationPool[i]);
        }
        elite_Chs = setElite(generationPool);
        G_printf(generationPool,elite_Chs);//1세대 출력
        for(int i=0; i<newGenerNum;i++){
            generationPool = nextG(generationPool, elite_Chs);
            elite_Chs = setElite(generationPool);
            G_printf(generationPool,elite_Chs); //각 세대 확인
            if(elite_Chs[0].fit < limitSolution){//작은게 좋은거
                System.out.println("결과를 구하였습니다.");
                bestSolution = elite_Chs[0];
                break;
            }
//          if(elite_Chs[0].useFit > limitSolution)//큰게 좋은거
//              System.out.println("설정한 최소값에 대한 결과값을 구하지 못하였습니다.");
//              bestSolution = elite_Chs[0];
//              break;
        }
        bestSolution = elite_Chs[0];
        System.out.println("설정한 최소값에 대한 결과값을 구하지 못하였습니다.");
    }
     
    //외부로부터 최고값 출력
    public int getBestCost(){
        return bestSolution.fit;
    }
     
    //외부로부터 최고값의 결로 출력
    public String getBestPath(){
        String path=null;
        for(int i=0; i<ch_len;i++){
            path+=bestSolution.order[i]+" ";
        }
        return path;
    }
     
     
    //첫번째 세대를 만들어 주는 함수 - 상황에 따라 변경
    private void setFirst_G(chromosome ch){
        int[] tempArr = new int[ch_len];
        for(int i=0;i<ch_len;i++)
            tempArr[i] = i;
        //셔플부분
        int seed;
        int temp;
        for(int i=1;i<ch_len;i++){
            seed=(int)(Math.random()*(ch_len-1))+1;
            temp = tempArr[i];
            tempArr[i]=tempArr[seed];
            tempArr[seed]=temp;
        }
        ch.order = tempArr;
    }
     
    //염색체에 대한 적합도를 측정한다.
    //크기가 작은게 좋은 경우 useFit으로 해서 계산한다. Why 그래야 나중에 계산하기 편함
    private void calFit(chromosome ch){
        int sumOfcost = 0;
         
        for(int i=0;i<ch_len-1;i++){
            sumOfcost += dataMatrix[ch.order[i]][ch.order[i+1]];
        }
         
        ch.fit = sumOfcost;
        if(thresholds_fit==0)//thresholds_fit이 0이면 Fit값이 큰게 좋은거
            ch.useFit = sumOfcost;
        else    //반대로 thresholds_fit값이 있으면 작은게 좋은거
            ch.useFit = thresholds_fit-sumOfcost;
    }
     
    //엘리트 염색체를 구한다.
    private chromosome[] setElite(chromosome[] generationPool){
        chromosome temp[] =  new chromosome[eliteNum+1];
        chromosome result[] =  new chromosome[eliteNum];
        for(int i=0;i<eliteNum;i++)
            temp[i] = generationPool[i];
        for(int i=eliteNum;i<FG_Num;i++){
            temp[eliteNum] = generationPool[i];
            Arrays.sort(temp);
        }
        for(int i=0;i<eliteNum;i++){
            result[i] = temp[i];
        }
        return result;
    }
     
    //다음 세대를 구하는 함수이다.
    private chromosome[] nextG(chromosome[] generationPool, chromosome[] elite_Chs){
        chromosome[] newGeneration = new chromosome[FG_Num];
        int s_ch1=-1, s_ch2=-1;
        int allArea = 0;
        int area[] = new int [FG_Num];
         
        for(int i=0;i<FG_Num;i++)
            allArea+=generationPool[i].useFit;
        for(int i=1;i<FG_Num;i++){
            area[i]=(int)((float)generationPool[i].useFit/allArea*1000);
            area[i]+=area[i-1];
        }
        for(int i=0;i<eliteNum;i++)
            newGeneration[i] = elite_Chs[i];
        for(int i=eliteNum;i<FG_Num;i++){
            s_ch1=-1;
            s_ch2=-1;
            while(s_ch1 == s_ch2){
                s_ch1 = ch_Select(area);
                s_ch2 = ch_Select(area);
            }
            //System.out.println("ch1 : "+s_ch1+" ch2 : "+s_ch2);
            newGeneration[i] = crossover(generationPool[s_ch1],generationPool[s_ch2]);
            mutation(newGeneration[i]);
            calFit(newGeneration[i]);
        }
        return newGeneration;
    }
     
    //염색체를 교배하는 함수이다. 이 함수가 알고리즘의 성능을 좌우한다.
    private chromosome crossover(chromosome ch1, chromosome ch2) {
        int cutPoint = FG_Num/2;
        chromosome child_Ch = new chromosome(ch_len);
        for(int i=0; i<ch_len;i++){
            if(i<cutPoint)
                child_Ch.order[i] = ch1.order[i];
            else
                child_Ch.order[i] = ch2.order[i];
        }
         
        for(int i=cutPoint; i<ch_len;i++){
            if(child_Ch.isExist(ch2.order[i], i)){
                for(int j=0; j<cutPoint;j++){
                    if(!child_Ch.isExist(ch2.order[j], i)){
                        child_Ch.order[i] = ch2.order[j];
                        break;
                    }
                }  
            }
        }
        return child_Ch;
    }
 
    //크기에 따라 확률이 다른 선택방법이다.
    private int ch_Select(int[] area){
        int seed;
        seed=(int)(Math.random()*1000)+1;
        for(int i=1;i<FG_Num;i++){
            if(area[i]>seed){
                return i;
                }
        }
        return 0;
    }
     
    //돌연변이 생성 함수이다.
    private void mutation(chromosome ch){
        int seed, changeAt, temp;
        for(int i=1;i<ch_len;i++){
            seed = (int)(Math.random()*1000)+1;
            if(seed<11){
                changeAt = (int)(Math.random()*ch_len-1)+1;
                temp = ch.order[i];
                ch.order[i] = ch.order[changeAt];
                ch.order[changeAt] = temp;
            }
        }
    }
     
    //한 세대의 염색체를 모두 출력하는 함수이다.
    private void G_printf(chromosome[] generationPool, chromosome[] elite_Chs){
        for(int i=0;i<FG_Num;i++){
            System.out.print("[");
            for(int j=0;j<ch_len;j++){
                System.out.print(generationPool[i].order[j]+" ");
            }
            System.out.print("] : ");
            System.out.println(generationPool[i].useFit+" "+generationPool[i].fit);
        }
        System.out.println("========elite========");
        for(int i=0;i<eliteNum;i++){
            System.out.print("[");
            for(int j=0;j<ch_len;j++){
                System.out.print(elite_Chs[i].order[j]+" ");
            }
            System.out.print("] : ");
            System.out.println(elite_Chs[i].useFit+" "+elite_Chs[i].fit);
        }
        System.out.println("=========================");
    }
     
    //염색체 클레스이다.
    private class chromosome implements Comparable<chromosome>{
        int order[] = null;
        int fit=0;
        int useFit=0;
        chromosome(int ch_len){
            order = new int[ch_len];
        }
        public int compareTo(chromosome ch) {
            return ch.useFit-this.useFit;  // 자기 자신이 기준이 되면 오름차순
        }                                   //상대가 기준이면 내림차순 feat.sort
        public boolean isExist(int data, int currentAt){
            for(int i=0;i<ch_len;i++){
                if(i!=currentAt){
                    if (order[i]==data)
                        return true;
                }
            }
            return false;
        }
    }
}

유전 알고리즘(JAVA).zip


반응형

유전 알고리즘(Genetic Algorithm)(2)-MST(java)

유전 알고리즘
반응형


출처: https://twinw.tistory.com/2?category=543725 [흰고래의꿈]


앞에서 포스팅한 글에서 예시로 다루었듯이

모든 도시를 최단으로 방분하는 경우

 Minimum Spaning Tree를 유전알고리즘으로 하여 구해보도록 하겠습니다. 

사용 언어는 나중에 안드로이드 개발에 사용하기 위해 자바로 하였고

오늘 포스팅은 데이터를 외부에서 가져오는 것까지하고

실질적인 유전알고리즘에 대한 코드는 다음 포스팅에서 설명해드리겠습니다.

 

데이터 파일은 첨부파일에 보시면 됩니다.

samples.zip


import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
 
public class MST {
    public static void main(String[] argv){
        String fileName = "input.dat";
        int[][] dataMatrix = null;
        int nodeNum = 0;
        String temp;
     
        try {
            FileReader Fr = new FileReader(fileName);
            BufferedReader Br = new BufferedReader(Fr);
            try {
                if(Br.ready()){
                    System.out.println("파일이 로드 되었습니다.");
                    nodeNum = Integer.valueOf(Br.readLine());
                    dataMatrix = new int [nodeNum][nodeNum];
                    while((temp=Br.readLine())!=null){
                        dataMatrix[Integer.valueOf(temp.split(" ")[0])]
                                [Integer.valueOf(temp.split(" ")[1])] = Integer.valueOf(temp.split(" ")[2]);
                        dataMatrix[Integer.valueOf(temp.split(" ")[1])]
                                [Integer.valueOf(temp.split(" ")[0])]= Integer.valueOf(temp.split(" ")[2]);
                    }
                }
            catch (IOException e) {
                System.err.println("파일 로드를 실패했습니다..");
            }
        catch (FileNotFoundException e) {
                System.err.println("다음 파일이 없습니다. : " + fileName);
        }
        //입력확인
//      for(int i=0; i<nodeNum;i++){
//          for(int j=0; j<nodeNum;j++){
//              System.out.print(dataMatrix[i][j]+" ");
//          }
//          System.out.println();
//      }
         
        //데이터 + 염색체 길이 + 염색체 갯수 + 목적치 + th_fit + 엘리트수 + 교배횟수
        GA mGA = new GA(dataMatrix, nodeNum,10,1000,80000,2,10000);
    }
}




반응형

CSP vs BFS vs GA for N-Queen

유전 알고리즘
반응형

출처: https://redcarrot.tistory.com/49


- Constraint Satisfaction Problem (CSP; 제약 만족 문제)

- 사람이 수행하는 systematic적인 search를 효과적으로 할 수 있도록 하며 검색 공간을 줄여주는 방법임
- 문제를 해결하는 제약조건을 이용하여 결과를 검사하고 결과를 만들어 낼 때도 사용됨
- 체계적으로 optimal한 값을 찾으며, trace를 원할 때에는 CSP가 유리함
- 어떤 문제에 대해 제약조건만을 바꿔주면 문제를 해결할 수 있음 (독립적)
- 탐색 중 제약조건을 하나라도 어긋나면 탐색을 중지하는 예측적 성향도 있음

- Best First Search (BFS; 최적 우선 탐색)
- Stochastic적인 search를 하는 방법임
- Heuristic search의 한 종류로 얼마나 효과적인 heuristic function을 사용하느냐에 따라 문제를 해결하는 속도가 좌우됨
- 문제마다 평가함수(evaluation function)를 새로 작성해야 하므로 문제에 대하여 종속적임

- Genetic Algorithm (유전 알고리즘)
- Stochastic적인 search를 하는 방법임
- 식물이나 동물의 유전자 모양으로 search를 하는 것임
- 결과를 못 찾을 수도 있으며, 결과를 찾는다 하여도 찾는 과정은 알 수 없음(trace 불가능)
- near optimal 값을 찾기 쉽고, parallel 처리가 가능하고 local maximum에 빠지지 않는 장점이 있음
- 단점으로 답 사이로 값들이 진행될 수 있고, trace가 불가능 함
- 문제를 어떻게 gene으로 묘사하느냐에 따라 해결 속도와 near optimal를 찾는 것이 다름

- CSP vs BFS vs GA
 CSP BFS
 GA
 Systematic search Stochastic search Stochastic search
 체계적으로 Optimal를 찾을 수 있음
 (단 존재한다면)
 Near optimal를 쉽게 찾을 수 있음 Near optimal를 쉽게 찾을 수 있음
 결과를 못찾을 수도 있음
 불필요한 시간이 소요될 수 있음
 Constraint에 따라 search space를
 filtering 하여 문제를 해결 가능
 어떤 Heuristic function을 사용했는지에
 따라 수행속도가 다름
 Gene을 어떻게 표현하였는지와
 operator의 사용에 따라 다름
 Constraint 자체가 heuristic 각 state를 평가할 수 있는 
 heuristic function
 확률 자체가 heuristic임
 병렬 탐색 가능
 trace 가능 trace 가능 trace 불가능

- N-Queen problem
- N * N 크기의 체스판 위에 n 개의 퀸이 서로를 공격하지 못하는 위치에 배치하는 문제
- 어느 행, 열, 또는 대각선에도 반드시 하나의 퀸만이 있어야 한다는 제약조건하에서 행과 열에 하나씩 배치하는 문제
- NP-Hard문제, 체스판의 크기가 커질수록 탐색 공간이 기하급수적으로 커지는 특성이 있음

- CSP : 4-Queen 문제의 경우
- domain variable = { Q1, Q2, Q3, Q4 }
- domain value = { 1, 2, 3, 4 }
- constraint  = { Q1 ≠ Q2, Q2 ≠ Q3, Q3 ≠ Q4, Q1 ≠ Q2-1, Q1 ≠ Q2+1, ... }
- 다음과 깉은 트리에서 검색할 때 위의 제약조건에 맞지 않는 노드는 더 이상 그 하위 노드를 검색하지 않는다.
- 모든 Tree를 가지고 검색하는 일반적인 검색보다 제약 조건을 두어 조건을 만족하지 않는 Tree의 가지를 검사하지 않음으로서 시간적으로 수행 능력이 향상된다.


- GA : 8-Queen 문제의 경우
- 염색체 표현 방법
- Random number
Queen이 위치할 좌표ㅡㄹ 숫자로 표현, 구현간단, 무효한 해가 많이 나옴
- Linear Random number
Queen의 좌표는 가로와 세로 어느 방향으로도 같은 위치를 가질수 없음에 착안
염색체에서 나타나는 숫자를 체스판의 각 열(또는 행)에 매칭
- Permutation
위 방법을 더욱 개선한 방식, Queen이 행 또는 열 상에서 충돌하는 해가 발생하지 않음을 보장
- Fitness function 
서로 공격하지 않는 Queen의 수
N이 목표값이며 높을 수록 좋음
- 랜덤한 Initial population을 생성하고 각 해의 fitness 함수 값을 계산
- Selection : 평가 값에 따라 해의 쌍을 선택
- Cross-over : 선택된 쌍의 값을 랜덤하게 교환
- Mutation : 랜덤한 값을 변경
- 위와 같은 한 번의 새대가 지난 후 다시 평가


- 각 연산자가 적용되는 모습


반응형