From 562f2f8462bcb84982212e662502beb3a7334764 Mon Sep 17 00:00:00 2001
From: Joshua Moerman <joshua.moerman@ou.nl>
Date: Tue, 26 Mar 2024 15:54:43 +0100
Subject: [PATCH] solver code verbeterd (veel sneller in geval van sat)

---
 other/decomp-sat.py | 156 ++++++++++++++++++++++----------------------
 1 file changed, 79 insertions(+), 77 deletions(-)

diff --git a/other/decomp-sat.py b/other/decomp-sat.py
index 7688939..a3b846d 100644
--- a/other/decomp-sat.py
+++ b/other/decomp-sat.py
@@ -1,116 +1,118 @@
-from pysat.examples.fm import FM
+from pysat.solvers import Solver
+from pysat.card import CardEnc
 from pysat.formula import IDPool
-from pysat.formula import WCNF
+from pysat.formula import CNF
 
 ### Gebruik:
-# Stap 1: pip install python-sat
+# Stap 1: pip3 install python-sat
 # Stap 2: python3 decomp-sat.py
 
 # TODO: Een L* tabel introduceren, en het aantal representanten van de rijen
 # minimaliseren, ipv representanten an sich.
 
+# Voorbeeld data
+# snel voorbeeld: n =  27, c = 3 en total_size =  9
+# langzaam vb.:   n = 151, c = 4 en total_size = 15
+n = 151
+c = 4
+total_size = 15 # als deze te laag is => UNSAT => duurt lang
+
+os = [i for i in range(n)] # outputs
+rids = [i for i in range(c)] # components
+
+# Optimale decompositie met slechts verzamelingen. Zie ook A000792 in de OEIS
+# (voor de omkering size -> n), dit groeit met de derdemacht. Dus size is
+# ongeveerde de derdemachts-wortel van n. Ik weet niet hoeveel c moet zijn.
+# n    =  1  2  3  4  5  6  7-9  10-12  13-18  19-27  28-36
+#     ------------------------------------------------------
+# c    ≥  1  1  1  1  1  2   2     2      3      ?      ?
+# size =  1  2  3  4  5  5   6     7      8      9     10
+
+
+print('Start encoding')
 vpool = IDPool()
-wcnf = WCNF()
+cnf = CNF()
+
+# Een hulp variabele voor False en True, maakt de andere variabelen eenvoudiger
+def var_const(b):
+  return(vpool.id(('bool', b)))
+
+cnf.append([var_const(True)])
+cnf.append([-var_const(False)])
 
 # Voor elke relatie en elke twee elementen o1 en o2, is er een variabele die
-# aangeeft of o1 en o2 gerelateerd zijn. Hierbij moeten o1 en o2 verschillen.
-# En er is 1 variabele voor xRy en yRx, dus symmetrie is al ingebouwd.
+# aangeeft of o1 en o2 gerelateerd zijn. Er is 1 variabele voor xRy en yRx, dus
+# symmetrie is al ingebouwd. Reflexiviteit is ook ingebouwd.
 def var_rel(rid, o1, o2):
+  if o1 == o2:
+    return var_const(True)
+
   [so1, so2] = sorted([o1, o2])
-  return(vpool.id(("var_rel", rid, so1, so2)))
+  return(vpool.id(('var_rel', rid, so1, so2)))
 
 # Voor elke relatie, en elke equivalentie-klasse, kiezen we precies 1 element
 # als representant. Deze variabele geeft aan welk element.
 def var_rep(rid, o):
-  return(vpool.id(("var_rep", rid, o)))
-
-def append_hard(clause):
-  wcnf.append(clause)
-
-def append_soft(clause):
-  wcnf.append(clause, 1)
+  return(vpool.id(('var_rep', rid, o)))
 
 # Contraints zodat de relatie een equivalentie relatie is. We hoeven alleen
-# maar transitiviteit te encoderen.
-def append_eq_rel(rid, os):
+# maar transitiviteit te encoderen, want refl en symm zijn ingebouwd in de var.
+# Dit stukje van het encoderen duurt het langst.
+print('- transitivity')
+for rid in rids:
   for xo in os:
     for yo in os:
-      if yo == xo:
-        continue
       for zo in os:
-        if zo == xo or zo == yo:
-          continue
-        append_hard([-var_rel(rid, xo, yo), -var_rel(rid, yo, zo), var_rel(rid, xo, zo)])
-
-def append_eq_rel_all(rids, os):
-  for rid in rids:
-    append_eq_rel(rid, os)
+        # als xo R yo en yo R zo dan xo R zo
+        cnf.append([-var_rel(rid, xo, yo), -var_rel(rid, yo, zo), var_rel(rid, xo, zo)])
 
 # Constraint zodat de relaties samen alle elementen kunnen onderscheiden.
 # (Aka: the bijbehorende quotienten zijn joint-injective.)
-def append_injective(rids, os):
-  for xi, xo in enumerate(os):
-    for _, yo in enumerate(os[xi+1:], xi+1):
-      append_hard([-var_rel(rid, xo, yo) for rid in rids])
+print('- injectivity')
+for xi, xo in enumerate(os):
+  for yo in os[xi+1:]:
+    # Tenminste een rid moet een verschil maken
+    cnf.append([-var_rel(rid, xo, yo) for rid in rids])
 
 # De constraints die zorgen dat representanten ook echt representanten zijn.
-def append_reps(rids, os):
-  for rid in rids:
-    for xi, xo in enumerate(os):
-      # Belangrijkste: een element is een representant, of equivalent met een
-      # later element. We forceren hiermee dat de solver representanten moet
-      # kiezen (achter aan de lijst).
-      append_hard([var_rep(rid, xo)] + [var_rel(rid, xo, yo) for yo in os[xi+1:]] )
-      for _, yo in enumerate(os[xi+1:], xi+1):
-        # xo en yo kunnen niet beide een representant zijn, tenzij ze
-        # niet gerelateerd zijn.
-        append_hard([-var_rep(rid, xo), -var_rep(rid, yo), -var_rel(rid, xo, yo)])
-
-
-# Voorbeeld data
-os = ['x', 'y', 'z', 'w', 't'] # outputs
-rids = [1, 2] # components
-
-# alle constraints toevoegen
-append_eq_rel_all(rids, os)
-append_injective(rids, os)
-append_reps(rids, os)
-
-# We willen zo min mogelijk representanten. Dwz we willen zo veel mogelijk
-# elementen die geen representant zijn. Dat doen we met soft clausules en
-# MaxSAT optimaliseert dat.
+print('- representatives')
 for rid in rids:
-  for xo in os:
-    append_soft([-var_rep(rid, xo)])
+  for xi, xo in enumerate(os):
+    # Belangrijkste: een element is een representant, of equivalent met een
+    # later element. We forceren hiermee dat de solver representanten moet
+    # kiezen (achter aan de lijst).
+    cnf.append([var_rep(rid, xo)] + [var_rel(rid, xo, yo) for yo in os[xi+1:]] )
+    for _, yo in enumerate(os[xi+1:], xi+1):
+      # xo en yo kunnen niet beide een representant zijn, tenzij ze
+      # niet gerelateerd zijn.
+      cnf.append([-var_rep(rid, xo), -var_rep(rid, yo), -var_rel(rid, xo, yo)])
 
+# Tot slot willen we weinig representanten. Dit doen we met een "atmost"
+# formule. Idealiter zoeken we naar de total_size, maar die staat nu vast.
+print('- representatives at most k')
+cnf_optim = CardEnc.atmost([var_rep(rid, xo) for rid in rids for xo in os], total_size, vpool=vpool)
+cnf.extend(cnf_optim)
 
-# Probleem oplossen met solver :-). Het PySat pakket bevat nog andere
-# MaxSAT solvers: RC2 en LSU. Geen idee welke het beste is. Deze lijkt te
-# werken. RC2 kan ook nog meerdere oplossingen enumereren.
-with FM(wcnf) as fm:
-  if not fm.compute():
+# Probleem oplossen met solver :-).
+print('Start solving')
+print('- copying formula')
+with Solver(bootstrap_with=cnf) as solver:
+  print('- actual solve')
+  sat = solver.solve()
+
+  if not sat:
     print('unsat :-(')
-    exit
+    exit()
 
-  print(f'sat :-) with cost {fm.cost}')
+  print(f'sat :-)')
 
   # Even omzetten in een makkelijkere data structuur
-  m = fm.model
+  print('- get model')
+  m = solver.get_model()
   model = {}
   for l in m:
-    if l < 0:
-      model[-l] = False
-    else:
-      model[l] = True
-
-  # print equivalence relations
-  # for rid in rids:
-  #   for xi, xo in enumerate(os):
-  #     for _, yo in enumerate(os[xi+1:], xi+1):
-  #       if model[var_rel(rid, xo, yo)]:
-  #         print(f'{rid} => {xo} == {yo}')
-  #       else:
-  #         print(f'{rid} => {xo} != {yo}')
+    if l < 0: model[-l] = False
+    else: model[l] = True
 
   # print equivalence classes
   count = 0