parallel training of two small graphs

aimclub · Nov 3, 2023 · 4d3f552 · 4d3f552
1 parent d5eda94
commit 4d3f552
Showing 1 changed file with 377 additions and 0 deletions.
diff --git a/examples/synthetic_graph_evolution/one_graph_search_parallel.py b/examples/synthetic_graph_evolution/one_graph_search_parallel.py
@@ -0,0 +1,377 @@
+import collections
+from datetime import timedelta
+from functools import partial
+from wrapt_timeout_decorator import timeout
+from datetime import datetime
+from typing import Optional, Union, List
+
+import pandas as pd
+import time
+# import timeout_decorator
+
+from golem.core.dag.graph_delegate import GraphDelegate
+from golem.core.dag.linked_graph_node import LinkedGraphNode
+
+import igraph as ig
+import matplotlib.pyplot as plt
+import networkx as nx
+from random import choice, random, randint, sample, choices
+
+from examples.synthetic_graph_evolution.generators import generate_labeled_graph
+from golem.core.adapter.nx_adapter import BaseNetworkxAdapter
+from golem.core.optimisers.genetic.gp_optimizer import EvoGraphOptimizer
+from golem.core.optimisers.genetic.gp_params import GPAlgorithmParameters
+
+from golem.core.optimisers.adaptive.operator_agent import MutationAgentTypeEnum
+from golem.core.optimisers.adaptive.context_agents import ContextAgentTypeEnum
+
+from golem.core.optimisers.genetic.operators.base_mutations import MutationTypesEnum
+from golem.core.optimisers.genetic.operators.crossover import CrossoverTypesEnum
+from golem.core.optimisers.genetic.operators.inheritance import GeneticSchemeTypesEnum
+from golem.core.optimisers.objective import Objective
+from golem.core.optimisers.optimization_parameters import GraphRequirements
+from golem.core.optimisers.optimizer import GraphGenerationParams
+import numpy as np
+from golem.core.dag.verification_rules import has_no_self_cycled_nodes
+import random
+
+import pickle
+from functools import partial
+from itertools import combinations
+import math
+
+class GeneratorModel(GraphDelegate):
+    def __init__(self, nodes: Optional[Union[LinkedGraphNode, List[LinkedGraphNode]]] = None):
+        super().__init__(nodes)
+        self.unique_pipeline_id = 1
+
+    def number_of_nodes(self):
+        return len(self.nodes)
+
+    def degree(self):
+        edges = self.get_edges()
+        dic = {}
+        for num, i in enumerate(self.nodes):
+            dic[int(i.name)] = 0
+
+        if len(edges) > 0:
+            edges = np.array(edges)
+            edges = np.transpose(edges)
+            edge_1, edge_2 = edges.tolist()
+            dic_1 = collections.Counter(edge_1)
+            dic_2 = collections.Counter(edge_2)
+            for node in dic_1:
+                dic[int(node.name)] += dic_1[node]
+            for node in dic_2:
+                dic[int(node.name)] += dic_2[node]
+        return dic
+    def to_networkx(self):
+        G_new = nx.Graph()
+        G_new.add_nodes_from(list(range(len(self.nodes))))
+        edges = self.get_edges()
+        edges = np.array(edges)
+        new_edges = []
+
+        for edge in edges:
+            new_edges.append((int(edge[0].name),int(edge[1].name)))
+
+        #edges = edges.tolist()
+
+        G_new.add_edges_from(new_edges)
+        return G_new
+
+
+class GraphParallel():
+    def __init__(self, nodes: Optional[Union[LinkedGraphNode, List[LinkedGraphNode]]] = None, nodes2: Optional[Union[LinkedGraphNode, List[LinkedGraphNode]]] = None):
+        self.GraphA = GeneratorModel(nodes)
+        self.GraphB = GeneratorModel(nodes2)
+        self.unique_pipeline_id = 1
+        super().__init__()
+
+class GeneratorNode(LinkedGraphNode):
+    def __str__(self):
+        return self.content["name"]
+
+
+def run_graph_search(dense, cycle, path, star, size, num_edges, des_degree, des_cluster, des_num_nodes,des_num_nodes2,
+                     des_label_assort, des_asp, timeout=15, visualize=True):
+    print('start')
+    def overall_mape(des_values, fact_values):
+        mape = 0
+        for i, value in enumerate(des_values):
+            mape += np.abs(value - fact_values[i]) / value
+        return mape / len(des_values)
+
+    def g_ini_proccess(G):  # подсчет матрицы смежности нулевого графа и его матрицы наикротчайших путей
+        n = len(G.nodes())
+        # G_ig = ig.Graph.from_networkx(G)
+        asp_array = np.zeros((n, n))
+        for i in range(n):
+            for j in range(n):
+                if i != j:
+                    #  asp_array[i, j] = (ig.Graph.distances(G_ig,source=i, target=j)[0][0])
+                    asp_array[i, j] = (len(nx.shortest_path(G, i, j)) - 1)
+                    # len(nx.shortest_path(G, i,j))-1
+                    # (ig.Graph.shortest_paths(G_ig,source=i, target=j)[0][0])
+        return asp_array
+
+    def shortest_paths_kronecker(G,G2):
+        n = len(G.nodes())
+        e = len(G.edges())
+
+        n2 = len(G.nodes())
+        e2 = len(G.edges())
+
+        # print('lets check', G.edges())
+        asp_0 = g_ini_proccess(G)
+        asp_02 = g_ini_proccess(G2)
+
+        adj = np.diag([1] * n)  # nx.adjacency_matrix(G).todense()
+        asp_1 = np.where(adj == 1, adj, asp_0)
+
+        adj2 = np.diag([1] * n2)  # nx.adjacency_matrix(G).todense()
+        asp_12 = np.where(adj2 == 1, adj, asp_02)
+
+        asp_global = n * np.sum(np.triu(asp_02)) + (e - n) * np.sum(asp_12)
+
+        pairs_to_check = set(combinations(range(n), r=2)) - (G.edges() - list(nx.selfloop_edges(G)))
+
+        for pair in pairs_to_check:
+            asp_global += n * asp_0[pair[0], pair[1]]  # pair[0] pair[1] - это блоки b1, b2
+
+            for i in range(n2):
+                for j in range(i + 1, n2):
+                    asp_global += 2 * max(int(asp_0[pair[0], pair[1]]), int(asp_02[i, j]))
+
+        return asp_global * 2 / (n*n2(n*n2 - 1))
+
+
+
+    def label_assortativity(G):
+
+        G_new = nx.Graph()
+        G_new.add_nodes_from(G.nodes)
+        G_new.add_edges_from(G.get_edges())
+        # G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+        print('Graph in label assortativity', G_new.nodes())
+        G_new = nx.tensor_product(G_new, G_new)
+        #     print('Graph in label assortativity', G_new)
+        label_assort = 0
+        edges = G_new.edges()
+
+        edges = np.array(edges)
+        edges = np.transpose(edges)
+
+        if len(edges) > 0:
+            edge_1, edge_2 = edges.tolist()
+            for i in G.nodes:
+                s_l = 0
+                t = 0
+                ind_1 = []
+                ind_2 = []
+                for l, node in enumerate(edge_1):
+                    if node == i:
+                        ind_1.append(l)
+                    if edge_2[l] == i:
+                        ind_2.append(l)
+
+                result_1 = np.array(edge_2)[ind_1]
+                result_2 = np.array(edge_1)[ind_2]
+
+                for neigbour in result_1:
+                    t += 1
+                    if (neigbour.content['label'] == i.content["label"]):
+                        s_l += 1
+                for neigbour in result_2:
+                    t += 1
+                    if (neigbour.content['label'] == i.content["label"]):
+                        s_l += 1
+                if t > 0:
+                    label_assort += s_l / t
+
+            label_assort = label_assort / len(G.nodes)
+        return label_assort
+
+    def lab_assort_count(des_label_assort, G):
+
+        fact_label = label_assortativity(G)
+        return (des_label_assort - fact_label) * (des_label_assort - fact_label)
+
+    def asp_count(des_shortest_paths, G):
+        G_new = Init2.GraphA.to_networkx()
+        G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+        G_new2 = Init2.GraphB.to_networkx()
+        G_new2.add_edges_from(list(map(lambda x: (x, x), range(len(G_new2.nodes())))))
+
+        fact_asp = shortest_paths_kronecker(G_new,G_new2)
+        return (des_shortest_paths - fact_asp) * (des_shortest_paths - fact_asp)
+
+    def avg_deg_count(des_d, G):
+        G_new = nx.Graph()
+        G_new.add_nodes_from(G.nodes)
+        G_new.add_edges_from(G.get_edges())
+        G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+        G = nx.tensor_product(G_new, G_new)
+        d = np.mean(list(zip(*nx.degree(G)))[1])
+        return (d - des_d) * (d - des_d)
+
+    def avg_cluster_count(des_cl, G):
+        G_new = nx.Graph()
+        G_new.add_nodes_from(G.nodes)
+        G_new.add_edges_from(G.get_edges())
+        G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+        G = nx.tensor_product(G_new, G_new)
+        d = nx.average_clustering(G.to_undirected())
+
+        return (d - des_cl) * (d - des_cl)
+
+    # Generate initial population with random graphs
+    initial_graphs = []
+    print('start initializing')
+    for i in range(20):
+        Init2 = GraphParallel(nodes=[GeneratorNode(nodes_from=[],
+                                                    content={'name': vertex,
+                                                             'label': random.choices([0, 1], weights=[
+                                                                 0.5 + 0.5 * des_label_assort,
+                                                                 0.5 - 0.5 * des_label_assort], k=1)})
+                                      for vertex in range(des_num_nodes)], nodes2 =[GeneratorNode(nodes_from=[],
+                                                    content={'name': vertex,
+                                                             'label': random.choices([0, 1], weights=[
+                                                                 0.5 + 0.5 * des_label_assort,
+                                                                 0.5 - 0.5 * des_label_assort], k=1)})
+                                      for vertex in range(des_num_nodes2)])
+
+        init_edges = []
+        init_edges2 = []
+
+        i = 0
+        print('now edges',int((math.sqrt(des_num_nodes*des_degree/des_num_nodes2)*des_num_nodes)/2), int((math.sqrt(des_num_nodes2*des_degree/des_num_nodes)*des_num_nodes2)/2))
+
+        while i < int((math.sqrt(des_num_nodes*des_degree/des_num_nodes2)*des_num_nodes)/2):
+            # print(i)
+            node_1, node_2 = choices(Init2.GraphA.nodes, k=2)
+
+            if (node_1, node_2) not in init_edges and (node_2, node_1) not in init_edges and node_1 != node_2:
+                init_edges.append((node_1, node_2))
+                Init2.GraphA.connect_nodes(node_1, node_2)
+                i += 1
+
+        while i < int((math.sqrt(des_num_nodes2*des_degree/des_num_nodes)*des_num_nodes2)/2):
+            # print(i)
+            node_1, node_2 = choices(Init2.GraphB.nodes, k=2)
+            if (node_1, node_2) not in init_edges2 and (node_2, node_1) not in init_edges2 and node_1 != node_2:
+                init_edges2.append((node_1, node_2))
+                Init2.GraphB.connect_nodes(node_1, node_2)
+                i += 1
+
+        initial_graphs.append(Init2)
+
+        print('ended making graph')
+
+    G_new = Init2.GraphA.to_networkx()
+    G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+    G_new2 = Init2.GraphB.to_networkx()
+    G_new2.add_edges_from(list(map(lambda x: (x, x), range(len(G_new2.nodes())))))
+    G = nx.tensor_product(G_new, G_new2)
+
+    print('avg degree of found graph real: {} vs des:{}'.format(np.mean(list(zip(*nx.degree(G)))[1]), des_degree))
+    print('clustering coefficient real: {} vs des:{}'.format(nx.average_clustering(G.to_undirected()),
+                                                             des_cluster))
+    # print('label assortativity real: {} vs des: {} '.format(label_assortativity(found_graphs[0]), des_label_assort))
+    print('shortest paths real: {} vs des: {}'.format(shortest_paths_kronecker(G_new.to_undirected(),G_new2.to_undirected()) , des_asp))
+    print('actual shortest paths', nx.shortest_path_length(G.to_undirected()))
+    objective = Objective({'avg degree': partial(avg_deg_count, des_degree),
+                           'cluster coef': partial(avg_cluster_count, des_cluster),
+                           'shortest paths': partial(asp_count, des_asp)}, is_multi_objective=True)
+    # }, is_multi_objective=True)
+    # 'label assort': partial(lab_assort_count, des_label_assort)
+
+    # ,
+
+    # Setup optimization parameters
+    max_graph_size = des_num_nodes
+    requirements = GraphRequirements(
+        max_arity=max_graph_size,
+        max_depth=max_graph_size * 10000,
+        num_of_generations=600,
+        early_stopping_iterations=100,
+        timeout=timedelta(minutes=timeout),
+        n_jobs=-1,
+        num_edges=num_edges
+    )
+
+    mutation_types = [MutationTypesEnum.single_edge,
+                      MutationTypesEnum.single_edge_add,
+                      MutationTypesEnum.single_edge_del,
+                      MutationTypesEnum.batch_edge_5,
+                      MutationTypesEnum.star_edge_5,
+                      MutationTypesEnum.path_edge_5,
+                      MutationTypesEnum.cycle_edge_5,
+                      MutationTypesEnum.dense_edge_5,
+                      ]
+
+    if dense:
+        mutation_types.append(MutationTypesEnum.dense_edge)
+    if star:
+        mutation_types.append(MutationTypesEnum.star_edge)
+    if cycle:
+        mutation_types.append(MutationTypesEnum.cycle_edge)
+    if path:
+        mutation_types.append(MutationTypesEnum.path_edge)
+
+    gp_params = GPAlgorithmParameters(
+        max_pop_size=10,
+        crossover_prob=0.8,
+        mutation_prob=1,
+        genetic_scheme_type=GeneticSchemeTypesEnum.parameter_free,
+        multi_objective=objective.is_multi_objective,
+        mutation_types=mutation_types,
+        adaptive_mutation_type=MutationAgentTypeEnum.default,
+        context_agent_type=ContextAgentTypeEnum.adjacency_matrix,
+
+        crossover_types=[CrossoverTypesEnum.none]
+    )
+
+    graph_gen_params = GraphGenerationParams(adapter=BaseNetworkxAdapter())
+    all_parameters = (requirements, graph_gen_params, gp_params)
+
+    # Build and run the optimizer
+    optimiser = EvoGraphOptimizer(objective, initial_graphs, *all_parameters)
+    #found_graphs = optimiser.optimise(objective)
+
+   # if visualize:
+        # Restore the NetworkX graph back from internal Graph representation
+    #    found_graph = graph_gen_params.adapter.restore(found_graphs[0])
+
+
+       # G_new = found_graph.to_networkx()
+       # G_new.add_edges_from(list(map(lambda x: (x, x), range(len(G_new.nodes())))))
+       # G = nx.tensor_product(G_new, G_new)
+
+       # print('avg degree of found graph real: {} vs des:{}'.format(np.mean(list(zip(*nx.degree(G)))[1]), des_degree))
+       # print('clustering coefficient real: {} vs des:{}'.format(nx.average_clustering(G.to_undirected()),
+        #                                                         des_cluster))
+        # print('label assortativity real: {} vs des: {} '.format(label_assortativity(found_graphs[0]), des_label_assort))
+       # print('shortest paths real: {} vs des: {}'.format(shortest_paths_kronecker(G_new.to_undirected()), des_asp))
+
+        #return G_new
+
+
+des_num_nodes = max_graph_size = 20
+des_num_nodes2 = 30
+des_degree = 10
+num_edges = 5
+des_cluster = 0.3
+des_asp  = 2
+
+des_label_assort = 1
+
+cycle = False
+path = False
+dense = False
+star = False
+
+run_graph_search(dense=dense,cycle=cycle,path=path,star=star, size=16, num_edges=num_edges, des_degree=des_degree,
+                                                                              des_cluster=des_cluster, des_num_nodes=des_num_nodes,des_num_nodes2=des_num_nodes2,
+                                                                              des_label_assort=des_label_assort,des_asp=des_asp, visualize=True)
+   # pickle.dump(G_new.to_undirected(), open('G_40_8.pickle', 'wb'))