Het voorspellen van de impact van de input procesvariabelen op chemische processen is belangrijk om de performantie van deze laatste te voorspellen. Modellen die deze impact aan de hand van een mechanistische aanpak verklaren zijn zelden gemakkelijk beschikbaar, complex van aard en/of vereisen een lange ontwikkelingstijd. Met een verhoogde automatisering in de industrie en de beschikbaarheid van high-throughput experimentele data winnen de datagedreven machine learning modellen aan populariteit omwille van hun eenvoud en vereenvoudigde computationele inspanningen. In dit werk werd multi-output Fischer-Tropsch synthese gegevens die gegenereerd werden via een mechanistisch Single-Event MicroKinetic (SEMK) model geanalyseerd met verschillende machine learning modellen (ML) zoals Lasso, K Nearest Neighbors (KNN), Support Vector Regression (SVR), en Artificieel Neurale Netwerkregressie (ANN).Temperatuur en druk zijn geïdentificeerd als de dominante inputvariabelen. Van de beschouwde ML modellen is ANN naar voor gekomen als de superieur presterende in vergelijking met benchmark SEMK resultaten. Bovendien werd de validiteit van neurale netwerk voorspellingen geverifieerd aan de hand van de zogenoemde Shap-waarden interpretatietechniek. De relatieve impact van inputvariabelen verkregen door gebruik  te maken van Shap waarden op de omzetting volgt de orde van temperatuur (1x) > druk (0.22x) > ruimte-tijd (0.1x) > syngas ratio (0.03x). Temperatuur (1x) en druk (0.26x) blijven de dominante inputvariabelen voor de selectiviteit van lichte olefines, maar ruimte-tijd (0.03x) en syngas ratio (0.03x) worden vergelijkbaar. Dit werk biedt een referentiemethode voor de identificatie van geschikte ML modellen voor multi-output voorspellingen in chemische processen.

Het volledige artikel is te vinden bij https://www.sciencedirect.com/science/article/pii/S0921344922001045.