<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress.com" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>

<channel>
	<title>cil &amp;laquo; WordPress.com Tag Feed</title>
	<link>http://wordpress.com/tag/cil/</link>
	<description>Feed of posts on WordPress.com tagged "cil"</description>
	<pubDate>Sat, 06 Sep 2008 02:27:35 +0000</pubDate>

	<generator>http://wordpress.com/tags/</generator>
	<language>en</language>

<item>
<title><![CDATA[Common Intermediate Language]]></title>
<link>http://robertsundstrom.wordpress.com/?p=92</link>
<pubDate>Mon, 21 Jul 2008 13:30:34 +0000</pubDate>
<dc:creator>Robert</dc:creator>
<guid>http://robertsundstrom.wordpress.com/?p=92</guid>
<description><![CDATA[Common Intermediate Language, simply known as CIL, IL or MSIL (among the legacy coders). This is n]]></description>
<content:encoded><![CDATA[<p><em>Common Intermediate Language</em>, simply known as <em>CIL, IL</em> or <em>MSIL</em> (among the legacy coders). This is not to be confused with C Intermediate Language which is also abbreviated as CIL. CIL is a stack-based high-level assembly language which is used as an intermediate language by virtual machines such as the CLR (Common Language Runtime) and the Mono Runtime. It is because it has a fairly simple syntax that can easily be translated into native machine code. As a part of the Common Language Infrastructure (CLI, a standard developed by Microsoft) it is the most significant piece of the .NET Framework, among others. Compilers which are written for the specific frameworks support the CLI standard and are translated to CIL. This can be done entirely or partially, like C++/CLI (which can mix it with native code). Because of that they can interop with other programs written in other CLI languages through the virtual machine. CIL is cross-platform and can be be executed on different machine architectures without being modificated or recompiled. The only thing that is needed is an implementation of the virtual machine targeting the specific processor and operating system. CIL is also, in many aspects, similar to Java bytecode which is executed by the Java Virtual Machine (JVM).</p>
<p>CIL is stack-based, in difference to many native machine languages that are register-based. This means that everytime you want to manipulate an object (a type or an unit of code) you put it on the stack and call an <em>op code</em> (language instruction) that is performing an operation, i.g. adding two values. Thereby adding the two objects (Int32 or simply 32-bit integers) on the top of the stack and leaving the sum of those. The stack should be empty at the end of runtime. See the example.</p>
<p><strong>IL:<br />
</strong></p>
<pre>ldc.i4.3 //Loads a constant in the stack
ldc.i4.2
add</pre>
<p><strong>Stack:</strong></p>
<pre>2 //Int32
3 //Int32</pre>
<p>After the last operation (add) this will remain on the stack:</p>
<pre>5 //Int32</pre>
<p>If you had only one object on the stack and performed the add operation you would get a <em>stack underflow</em>.<br />
The opposite is <em>stack overflow</em> that is caused by objects remaining on the stack in the end of the program. These errors are often caused by bugged compilers.</p>
<p>Some common op codes are:</p>
<pre>ldstr "Kazoom" //Puts a string on the stack
ldarg.0 //Loads the method argument at the index 0 and puts it on the stack
ldc.i4.29 //Puts an integer, 29, on the stack
ldloca.s lcal //Loads a local (name lcal) an places it on top of the stack
call //Used when calling a method
newobj //Used when instanciating an object

// Arithmic operations that pops two values from the top of the stack.
add
sub
mul
div
mod</pre>
<p>This is the most simple part of the CIL language. Because of the object-oriented nature of CLI you are able to use some OOP approach in your programming. Many of the constructs found in the programming languages at a higher level are represented directly as IL. For instance, a class declaration looks like this:</p>
<pre>.class public MyClass
{

}</pre>
<p>A class can be declared as static (non-instance class) with the static attribute <code>static</code>.</p>
<pre>.class public static MyStaticClass
{

}</pre>
<p>Classes contains methods defined this way:</p>
<pre>.method Int32 Add(Int32, Int32)
{
      //Load both arguments on the stack and add them, then return the value.
      ldarg.0
      ldarg.1
      add
      ret
}</pre>
<p>Likewise to classes, methods can also be marked as static.</p>
<p>This syntax, is like the class syntax, very similar to the C style. The only difference is the IL opcodes instead of ordinary statements. Another thing you must know is that methods always ends with a return statement even though they do not seem to return any value. In reallity theres a value, <code>void</code>. This will the runtime engine (virtual machine) handle for you.</p>
<p>To make a method the entrypoint of the program you add the <code>.entrypoint</code> attribute inside the method body. Notice that you can only have one entrypoint in a program.</p>
<p>Local variables (mostly refered to as <em>locals</em>) are also defined as attributes inside a method.</p>
<pre>.locals init (
      [0] string str1
      [1] Int32 int1)</pre>
<p>Those locals named by the compilers often have a random name consisting of letters and a number.</p>
<p>Because of performance there is also a <code>.maxstack</code> attribute which sets the maximum numbers of items on the stack. This tells the runtime engine that this method needs a stack of this size. Now is the virtual machine able to manage the amount of memory.</p>
<p>There are a lot of other things as well. I will not dig deeper into it because it is to much at a time. If you are familiar with a high-level language or any other stack-based and object-oriented intermediate language, like the Parrot Intermediate Language you, should understand the IL too.</p>
<p>Finally, this is the Hello World program in IL style. You can try to assemble it with ILASM (IL Assembler) ported with .NET Framework or Mono.</p>
<pre>.method public static void Main() cil managed
{    
      .entrypoint    
      .maxstack 8    
      ldstr "Hello world!."    
      call void [mscorlib]System.Console::WriteLine(string)    
      ret
}</pre>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Bebek Beny]]></title>
<link>http://denizfili.wordpress.com/2008/07/16/bebek-beny/</link>
<pubDate>Wed, 16 Jul 2008 10:14:00 +0000</pubDate>
<dc:creator>beny</dc:creator>
<guid>http://denizfili.wordpress.com/2008/07/16/bebek-beny/</guid>
<description><![CDATA[Daha ortaokuldayken derste kütüphane ile ilgili bir oyun oynamıştık.Orada ben bilmiş ve seviml]]></description>
<content:encoded><![CDATA[<p>Daha ortaokuldayken derste kütüphane ile ilgili bir oyun oynamıştık.Orada ben bilmiş ve sevimli bir bebeği canlandırıyordum.Elimde oyuncak makinalarından kazandığım mavi ayıcıkla,üzerimde bana 3-5 beden küçük gelen bebeklik hırkamla,yüzümde annemin göz kalemiyle yapılmış çillerle pek sevimli olmuştum doğrusu.Kendimi rolüme entegre etmiştim tam üç gün boyunca evde,okulda onun konuşmasıyla konuştum.Annem babama onlarca kez oynayıp,herkese öğretmiştim.Hatta resimlerimi çekmiştim,bakınca resme sevesim,oy oy oy oy diyesim gelmişti.</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[CIL Programming, presque under the hood of .NET]]></title>
<link>http://romainverdier.wordpress.com/?p=115</link>
<pubDate>Thu, 10 Jul 2008 19:40:29 +0000</pubDate>
<dc:creator>Romain Verdier</dc:creator>
<guid>http://romainverdier.wordpress.com/?p=115</guid>
<description><![CDATA[J&#8217;ai terminé il y a quelques semaines la lecture d&#8217;un des seuls livres publiés au suje]]></description>
<content:encoded><![CDATA[<p>J'ai terminé il y a quelques semaines la lecture d'un des seuls livres publiés au sujet du langage intermédiaire de la plateforme .NET. J'ai nommé <a href="http://www.amazon.fr/CIL-Programming-Under-Hood-NET/dp/1590590414"><strong>CIL Programming, Under the hood of .NET</strong></a> de <a href="http://www.jasonbock.net">Jason Bock</a>. </p>
<p>Je me suis appliqué, un parfait <em>cover to cover</em>, mais je le regrette un peu. Il ne doit pas être évident d'écrire un livre sur un sujet aussi <strike>chiant</strike> particulier, donc je ne peux raisonnablement pas être aussi acerbe que déçu. Car j'ai été assez déçu.<br />
<!--more--></p>
<p><img src="http://romainverdier.wordpress.com/files/2008/07/cilprogramming.png" class="alignright image-border" />Si on ne s'attend pas à mourir de rire à chaque page lorsqu'on entame la lecture d'un livre du genre (avez-vous déjà essayé de faire une blague sur le <a href="http://en.wikipedia.org/wiki/MSIL">CIL</a> ?), on espère au moins en tirer quelque chose, ou plus exactement, quelque chose que l'on n'aurait pas pu - ou pas mieux pu - apprendre ailleurs. <em>CIL Programming</em> m'a donné l'impression d'être trop souvent approximatif à plusieurs niveaux : structure, rédaction, exemples, blagues (oui, Jason a essayé), références, etc. Pour être honnête, j'ai abordé cette lecture avec pour objectif d'acquérir une meilleure compréhension du langage intermédiaire de la plateforme .NET et plus particulièrement des possibilités offertes aux langages de plus haut niveau quant à sa génération/manipulation ; mais j'avais déjà une compréhension globale du langage ainsi qu'une expérience assez modeste de l'API <code>System.Reflection.Emit</code>.</p>
<p>C'est peut-être pour cette raison que j'ai été déçu. Quoi qu'il en soit, il serait dommage qu'en ayant une connaissance superficielle du sujet on en sache déjà trop pour trouver la lecture profitable. On parle bien d'un <strong>livre</strong>, hein, pas d'un article de blog ou d'un post dans le forum de <a href="http://www.codes-sources.com/">codes-sources.com</a>.</p>
<p>Le livre progresse doucement, trop doucement ; il frôle parfois le formalisme soporifique d'une spécification de langage sans pour autant parvenir au même niveau de complétude et de concision. Beaucoup de questions sont laissées en suspens malgré l'abus de références croisées (assez fatigantes), et cela conduit inévitablement le lecteur à se demander s'il n'a pas été trompé lorsqu'il arrive aux annexes.</p>
<p>Outre les chapitres qui listent les différents codes d'opérations du langage, vous pourriez éventuellement trouver un intérêt à lire en diagonale au moins les chapitres 5, 6 et 7 (cf. liste ci-dessous). Le chapitre 8, qui aurait pu être le plus intéressant pour les développeurs voulant générer dynamiquement du CIL est finalement compromis par la qualité de l'exemple lui-même (pourtant pertinent).</p>
<p>Pour le contenu, voici la liste des chapitres :</p>
<ul>
<li>Chapter 1: Language Interoperability</li>
<li>Chapter 2: ILASM Directives and Attributes</li>
<li>Chapter 3: CIL Opcodes</li>
<li>Chapter 4: ILASM and CIL in Practice</li>
<li>Chapter 5: Debugging CIL</li>
<li>Chapter 6: .NET Languages and CIL</li>
<li>Chapter 7: Emitting Types</li>
<li>Chapter 8: Dynamic Proxies in .NET</li>
<li>Chapter 9: CIL Tips</li>
<li>Appendix A The Future of CIL</li>
<li>Appendix B .NET</li>
</ul>
<p>Au risque donc de paraitre déraisonnable, je vous déconseille assez franchement ce livre.</p>
<div class="bookreview">
<div class="booktitle">CIL Programming, Under the hood of .NET</strong></div>
<div class="bookauthor">Jason Bock</div>
<div class="bookscore">8/20</div>
</div>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Building a compiler for the .NET Framework - Report 2]]></title>
<link>http://robertsundstrom.wordpress.com/?p=79</link>
<pubDate>Thu, 12 Jun 2008 23:13:19 +0000</pubDate>
<dc:creator>Robert</dc:creator>
<guid>http://robertsundstrom.wordpress.com/?p=79</guid>
<description><![CDATA[I have written a lot of code since my last post (Report 1). I have written a parser (an object-orien]]></description>
<content:encoded><![CDATA[<p>I have written a lot of code since my last post (Report 1). I have written a parser (an object-oriented) that is working, everything but expression parsing. Not yet! Then I started on the code generator which ended up quite well. The only thing I really hate is that I can't find a way to generate two types with fields of the other type. I have to find a solution soon... and I will. I'm sure. I'm also working on a new symbol table class that I want to use during code generation.</p>
<p>Please check out my compiler (Pascal Compiler for .NET Framework v.0.0.1).<br />
Requires Windows XP/Vista and .NET Framework 3.5.</p>
<p><a href="http://www.mediafire.com/?b5njejcdmqk">Download it here!</a></p>
<p> </p>
<h3>Notes:</h3>
<p>The compiler...</p>
<ul>
<li>supports definitions of types, functions, procedure and variables.</li>
<li>supports Primitive types such as Integer, Double, Boolean, Char and String.</li>
<li>has these Complex types: Record, Enum and Dynamic Array.</li>
<li>can only parse the expression WriteLn([stringliteral]);</li>
<li>only supports single sourcefiles.</li>
</ul>
<p> </p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Building a compiler for the .NET Framework - I : Introduction]]></title>
<link>http://robertsundstrom.wordpress.com/?p=70</link>
<pubDate>Sat, 31 May 2008 13:07:09 +0000</pubDate>
<dc:creator>Robert</dc:creator>
<guid>http://robertsundstrom.wordpress.com/?p=70</guid>
<description><![CDATA[I have been working on a compiler for the .NET Framework, i.e. a compiler that produces IL instead ]]></description>
<content:encoded><![CDATA[<p>I have been working on a compiler for the .NET Framework, i.e. a compiler that produces IL instead of ordinary machine code. I want to share my plans and thoughts about this little compiler I'm working on.<br />
In this blogpost I'll concentrate on explaining my project.</p>
<p>First I just want to explain some words that I will or may use in this series of articles.</p>
<ul>
<li><strong>assembly language</strong> - machine specific language dependend of the instruction set of the system.</li>
<li><strong>programming language</strong> - a language constructed to make software development easier by introducing certain abstractions that makes it easier for humans to write and understand.</li>
<li><strong>compiler</strong> - a program that compiles (translates) codes written in a <em>high level-language</em> into object code (assembly language). A compiler for a assembly language is usualy called <em>assembler</em>.</li>
<li><strong>IL</strong> (a.k.a <em>CIL</em> and <em>MSIL</em>) is a high-level assembly language created by Microsoft that is to be executed on a <em>virtual machine</em> made according the <em>Common Language Infrastructure</em> standard. Can be executed by <em>virtual machines</em> such as the <em>CLR (Windows)</em> or the <em>Mono Runtime (Linux)</em>. This means that IL is not bound to a specific platform, in contrast to native <em>assembly languages</em>. IL is Microsoft's response to Sun's <em>Java Bytecode</em>.</li>
<li><strong>virtual machine</strong> - A program working on top of a system that simulates another system. In this case the<em> CLR</em> or the <em>Java Runtime </em>that is converting <em>bytecode</em> into <em>native code</em> (object code) and executes it. A virtual machine can therefore test the code and then execute it if it does not contain any errors or bad code.</li>
<li><strong>front-end </strong>and<strong> back-end </strong>are terms used in compiler construction. <em>Front-end</em> usaully refers to the <em>scanner</em> and <em>parser. </em>That is why scanner and parser sometimes is incorrectly known as the parser. The <em>Back-end</em> contains the <em>code generator</em> and <em>preprocessor</em> (if any). The idea of these two is that you can switch parts, for example writing a new code generator for another system, without changeing the rest (the front-end).</li>
<li><strong>lexical scanner</strong>,<strong> lexer</strong> or <strong>scanner </strong>is a program that creates <em>tokens</em> of the input code by following a set of rules. A scanner is usually constructed to work as a <em>Defininite State Machine</em> and use<em> regualar expressions</em>. We have for example the following line of code (written in C-style): <em>int myNumber = 20 + 3; "int"</em><strong> </strong>would be a keyword, <em>"myNumber"</em> a identifier, "=" an operator, <em>"20"</em> a number or integral and so on. Scanners are often generated by a<em> scanner generator</em> because they are performing better than those written by programmers. </li>
<li><strong>parser</strong> - A program that is considered the heart of the compiler because it is creating a presentation of the code that is easier to use when generating machine code. The parser is following rules that decides how the code is going to be interpreted and then creates an <em>Abstract Syntax Tree</em> (AST).<br />
The AST is then easily converted to machine code by the code generator.</li>
</ul>
<p>I am using an object-oriented approach when constructing my compiler. That means that there will be objects that will symbolize for example tokens, the scanner, the parser and the code generator. Why? Because it is a lot easier to think that way. I cannot manage to do this the procedural way like legendary constructors like Niklaus Wirth did. Another reason is that I am a OOP programmer and I'm attached to C# and the .NET Framework.</p>
<p>The purpose of this project is only educational. I want to learn how a compiler works and especially the parts of it. I am not trying to build a "perfect" compiler that supports all the CLR features. I will not concentrate on the performance either because that is not important. I want the compiler to work before I think of that, and of course it is of beyond the scope of this project.</p>
<p>I want the back-end and front-end to be separate and independent in that way that you can reuse its components and modify them if necessary. But I will firstly concentrate on getting everything working and then try to make these changes.</p>
<p><span style="text-decoration:line-through;">I have defined a small OO language called <em>Simple Programming Language</em> that I will use as the source language compiled by the compiler that I will write. More details on it in one of the following blogposts.</span></p>
<p>I have decided to implement Pascal instead of my own SPL. It's because I have had som issues with it. It is not a good thing to start implementing a compiler for a full OOP langauge as ones first real project.</p>
<p>Anyway, stay tuned!</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Rockin' robin' tweet tweetly-tweet]]></title>
<link>http://notatech.wordpress.com/?p=16</link>
<pubDate>Mon, 19 May 2008 03:39:31 +0000</pubDate>
<dc:creator>mlibrarianus</dc:creator>
<guid>http://notatech.wordpress.com/?p=16</guid>
<description><![CDATA[Heavens, Twitter (which I just discovered was written using Ruby on Rails how cool is that) is all t]]></description>
<content:encoded><![CDATA[<p>Heavens, <a href="http://twitter.com/">Twitter</a> (which I just discovered was written using Ruby on Rails how cool is that) is all the buzz these days.  Not only has it made the news (BBC) but there are add-ons for Firefox, clients so you can Twitter without bringing up a browser, and tweet from your Facebook page.  I had no idea when I signed onto Twitter a year ago (after hearing everyone at CIL go on about it) that it was such a phenomenon.</p>
<p>Some interesting ways Twitter can and is being used:</p>
<p>Businesses can use <a href="http://www.labnol.org/internet/tools/twitter-grow-business-most-useful-twitter-services/3022/">Twitter tools </a>to help them.</p>
<p>For <a href="http://oracleappslab.com/2008/03/11/twitter-as-customer-support/">customer service support</a></p>
<p><a href="http://ryankarpeles.blogspot.com/2007/06/17-uses-for-twitter-and-counting.html">Marketing related uses for Twitter</a></p>
<p><a href="http://www.techradar.com/news/internet/twitter-first-to-report-on-chinas-earthquake-366217">Way to report the news</a> (forget email Breaking News updates)</p>
<p><a href="http://blog.makezine.com/archive/2008/02/how_to_make_plants_talk_t.html">Water your plants via Twitter</a></p>
<p><a href="http://pctips.northglow.com/twitter/share-photos-on-twitter-with-twitpic/">Share your photos</a></p>
<p><a href="http://www.twitterfeed.com/">Share your blog posts</a></p>
<p><a href="http://elliottback.com/wp/archives/2007/04/04/twitter-weather-in-php/">Get a weather forcast</a></p>
<p><a href="http://www.tweetwhatyoueat.com/">Keep track of your diet</a></p>
<p><a href="http://www.innertwitter.com/">Reminder to step back and reflect</a></p>
<p><a href="http://www.rememberthemilk.com/">Remember the milk</a> (manage your tasks)</p>
<p><a href="http://twittervision.com/">See where all the tweets come from</a> (maps)</p>
<p><a href="http://blog.wired.com/underwire/2008/03/true-story-of-a.html">Propose to someone</a></p>
<p>I even use it as a safety feature.  When I'm out walking the dogs in remote areas, I make sure I Twitter what I'm doing and where from my Facebook app on my Blackberry.  Who knew that Twitter was this and much, much more...</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Continuer l'optimisation avec la Lightweight Code Generation (LCG)]]></title>
<link>http://romainverdier.wordpress.com/?p=34</link>
<pubDate>Tue, 06 May 2008 13:46:33 +0000</pubDate>
<dc:creator>Romain Verdier</dc:creator>
<guid>http://romainverdier.wordpress.com/?p=34</guid>
<description><![CDATA[Cet article est un complément du précédent. Vous pouviez y lire dans la conclusion :
Nous nous so]]></description>
<content:encoded><![CDATA[<p>Cet article est un complément du <a href="http://codingly.com/2008/05/02/optimisation-des-invocations-dynamiques-de-methodes-en-c/">précédent</a>. Vous pouviez y lire dans la conclusion :</p>
<blockquote><p>Nous nous sommes contentés d’évoquer la solution d’optimisation impliquant la génération de code IL. Dans le contexte de la problématique discutée, elle n’offrait aucun avantage par rapport à celle que nous avons exposée. Pire, elle imposait une étape inutile. Toutefois, certains besoins plus complexes dépassent le cadre des invocations dynamiques de méthodes et peuvent tout de même être adressés efficacement en recourant à la génération de bytecode.</p></blockquote>
<p>S'il existe des scénarios dans lesquels le recourt à la <a href="http://msdn.microsoft.com/en-us/library/system.reflection.emit.dynamicmethod.aspx">LCG</a> est inutile voire pénalisant, il n'y a parfois aucune autre alternative lorsqu'il s'agit de mettre en place une solution où les performances sont aussi importantes que la dynamicité.</p>
<p>Vous ne trouverez pas ici un tutorial sur l'utilisation de <code>Reflection.Emit</code>, mais plutôt un exemple d'utilisation de cette technique pour répondre de façon optimale à un besoin bien spécifique. Nous essaierons en parallèle de faire ressortir quelques guidelines relatives à l'usage de la LCG.<br />
<!--more--></p>
<h3>Mais c'est quoi, ce truc ?</h3>
<p>La LCG, ou Lightweight Code Generation, fait référence à une nouveauté apparue dans la seconde version du Framework .NET. </p>
<p>Il a toujours été possible en .NET d'utiliser l'API du namespace <code><a href="http://msdn.microsoft.com/en-us/library/system.reflection.emit.aspx">System.Reflection.Emit</a></code> pour générer des assemblies, des modules et des types dynamiquement. Le principe est simple : on autorise via cette API les développeurs de la plateforme .NET à produire directement du code intermédiaire. C'est extrêmement puissant, mais très rapidement complexe. Le fait que le CIL ainsi obtenu soit (<a href="http://blogs.msdn.com/jmstall/archive/2005/02/03/366429.aspx">quasiment</a>) impossible à débuguer ne vient pas arranger les choses.</p>
<p>C'était en quelque sorte la Heavyweight Code Generation : pour générer dynamiquement le <a href="http://en.wikipedia.org/wiki/Bytecode">bytecode</a> correspondant à un traitement, il fallait la plupart du temps se taper la création d'un assembly, d'un module et d'un type pour finalement héberger la méthode encapsulant l'opération. Tout cela est souvent nécessaire, mais le reste du temps, c'est juste lourd.</p>
<p>Typiquement, lorsqu'on utilise la génération de CIL pour créer un proxy dynamiquement, on veut définir un type complet avec ses membres et ses méthodes. En revanche, pour créer une simple méthode au runtime on préfèrerait s'en passer.</p>
<p>La LCG autorise justement la création de méthodes dynamiques pouvant être réclamées par le garbage collector, et surtout ayant la capacité d'être hébergées anonymement, sans que l'on ait à créer d'assembly, de module ou de type. Outre le fait que de telles méthodes soient relativement faciles à créer (je ne parle pas de la génération de leurs corps), elles peuvent également être invoquées via des délégués. Et ça on connait, c'est efficace.</p>
<h3>Parfois, c'est inutile</h3>
<p>Dans l'article précédent, nous avons vu comment il était possible de créer un délégué pointant sur un <code>MethodInfo</code> pour considérablement optimiser les invocations dynamiques. L'exemple s'y prêtait bien : nous connaissions la signature de la méthode à appeler dynamiquement donc nous pouvions :</p>
<ul>
<li>Définir un type de délégué correspondant</li>
<li>Solliciter la méthode <code>CreateDelegate</code> de la classe <code>Delegate</code></li>
<li>Invoquer le délégué ainsi récupéré</li>
</ul>
<p>C'est vraiment ce qu'il faut retenir. <strong>Il n'y a aucune raison d'utiliser la LCG si les signatures des méthodes à appeler dynamiquement sont connues</strong> et qu'il est possible de définir les délégués correspondants.</p>
<h3>Un exemple moins ingrat</h3>
<p>Vous aurez compris que lorsque la signature des méthodes à appeler dynamiquement n'est pas connue durant le design, il est impossible de déclarer un délégué correspondant à la méthode que l'on veut appeler. Il en découle que l'invocation via délégué est à oublier, et qu'il ne reste donc que la bonne vieille méthode <code>Invoke</code> sur le <code>MethodInfo</code>.</p>
<p>Oui, celle-la même qui ruine les performances.</p>
<p>A l'origine, je voulais trouver un exemple ni trop idiot ni trop complexe pour mettre ce cas en évidence et introduire la LCG. Finalement, je n'ai pas été capable de trouver quelque chose respectant cet équilibre. Vous aurez donc droit à un exemple vraiment simple et super idiot : le <strong>cloneur</strong>.</p>
<p>Commençons par en définir l'interface :</p>
<p>[code language='csharp']<br />
public interface ICloner<br />
{<br />
    object Clone(object toClone);<br />
}<br />
[/code]</p>
<p>Les types respectant ce contrat devront fournir via la méthode <code>Clone</code> un service capable de retourner un <a href="http://www.devx.com/tips/Tip/13625">shallow clone</a> de l'objet passé en paramètre. Pour simplifier ici, nous ne considèrerons que les propriétés publiques des objets.</p>
<p>Ecrivons directement un test unitaire :</p>
<p>[code language='csharp']<br />
[Test]<br />
public void Test()<br />
{<br />
    var cloner = GetCloner();<br />
    var p = new Person<br />
            {<br />
               Id = 1,<br />
               Firstname = "Romain",<br />
               Lastname = "Verdier",<br />
               BirthDate = new DateTime(1976, 03, 02),<br />
               Height = 1.65<br />
            };<br />
    var p2 = cloner.Clone(p) as Person;<br />
    Assert.AreNotEqual(p,p2);<br />
    Assert.AreEqual(p.Id, p2.Id);<br />
    Assert.AreEqual(p.Firstname, p2.Firstname);<br />
    Assert.AreEqual(p.Lastname, p2.Lastname);<br />
    Assert.AreEqual(p.BirthDate, p2.BirthDate);<br />
    Assert.AreEqual(p.Height, p2.Height);<br />
}<br />
[/code]</p>
<p>En utilisant simplement la réflexion, on peut proposer l'implémentation non optimisée suivante :</p>
<p>[code language='csharp']<br />
public class Cloner : ICloner<br />
{<br />
    private readonly Func<Type, Func<object, object>> clonerLocator;</p>
<p>    public Cloner()<br />
    {<br />
        this.clonerLocator = ((Func<Type, Func<object, object>>)GetCloner).Memoize();<br />
    }</p>
<p>    public object Clone(object toClone)<br />
    {<br />
        var cloner = this.clonerLocator(toClone.GetType());<br />
        return cloner(toClone);<br />
    }</p>
<p>    private Func<object, object> GetCloner(Type type)<br />
    {<br />
        var constructorInfo = type.GetConstructor(Type.EmptyTypes);<br />
        if (constructorInfo == null)<br />
        {<br />
            throw new ArgumentException(string.Format("'{0}' type doesn't have a default constructor.", type.Name));<br />
        }</p>
<p>        return toClone =><br />
        {<br />
            var clone = Activator.CreateInstance(type);<br />
            var propertyInfos = type.GetProperties(BindingFlags.Instance &#124; BindingFlags.Public);<br />
            foreach (var propertyInfo in propertyInfos)<br />
            {<br />
                var setterInfo = propertyInfo.GetSetMethod();<br />
                var getterInfo = propertyInfo.GetGetMethod();<br />
                if (setterInfo != null && getterInfo != null)<br />
                {<br />
                    // Deux invocations dynamiques ont lieu ici sans que l'on puisse<br />
                    // utiliser de délégués.<br />
                    setterInfo.Invoke(clone, new object[] {getterInfo.Invoke(toClone, null)});<br />
                }<br />
            }<br />
            return clone;<br />
        }<br />
    }<br />
}<br />
[/code]</p>
<p>Notons à propos du code précédent :</p>
<ul>
<li>Peu de vérifications sont faites, c'est à la fois volontaire et mal.</li>
<li>Nous n'utilisons pas <code>GetValue</code> et <code>SetValue</code> sur les <code>PropertyInfo</code> pour rendre les invocations dynamiques de méthodes explicites : ici, on fait deux invocations dynamiques par propriété. Une sur le getter, et une sur le setter.</li>
<li>Ne pas connaitre le type de chaque propriété à l'avance signifie que l'on ne connait pas la signature des getters et des setters. Ne pas connaître la signature des getters et des setters nous empêche d'utiliser la méthode décrite dans l'article précédent.</li>
<li>La <a href="http://codingly.com/2008/05/02/optimisation-des-invocations-dynamiques-de-methodes-en-c/">memoization</a> et l'utilisation d'un locateur ne servent qu'à faciliter la comparaison que l'on pourra faire avec la prochaine solution, puisqu'on ne peut pas utiliser de caching dans celle-ci.</li>
</ul>
<p>Puisque vous aimez les chiffres comme tout le monde, j'ai créé un test de performances effectuant un million d'appels à la méthode de clonage. Et houlala, c'est lent : <strong>1000000 appels en plus de 26 secondes</strong>.</p>
<p>En utilisant la LCG, il va être possible de générer une méthode encapsulant la logique de clonage relative à un type donné. On pourra également créer un délégué pour cette méthode, afin qu'elle puisse être invoquée sans que les performances ne soient dégradées. Ce délégué - et on rejoint ici le principe d'optimisation commun à toutes les solutions - pourra être mis en cache pour éviter que la méthode dynamique ne soit regénérée systématiquement.</p>
<p>Voyons ce que ça donne :</p>
<p>[code language='csharp']<br />
public class CilCloner : ICloner<br />
{<br />
    private readonly Func<Type, Func<object, object>> clonerLocator;</p>
<p>    public Cloner()<br />
    {<br />
        this.clonerLocator = ((Func<Type, Func<object, object>>) GetCloner).Memoize();<br />
    }</p>
<p>    public object Clone(object toClone)<br />
    {<br />
        var cloner = this.clonerLocator(toClone.GetType());<br />
        return cloner(toClone);<br />
    }</p>
<p>    private Func<object, object> GetCloner(Type type)<br />
    {<br />
        var constructorInfo = type.GetConstructor(Type.EmptyTypes);<br />
        if (constructorInfo == null)<br />
        {<br />
            throw new ArgumentException(string.Format("'{0}' type doesn't have a default constructor.", type.Name));<br />
        }</p>
<p>        var dynamicMethod = new DynamicMethod(string.Format("<{0}>DoClone", type.Name),<br />
                                              typeof (object),<br />
                                              new []{typeof (object)},<br />
                                              this.GetType());</p>
<p>        var propertyInfos = type.GetProperties(BindingFlags.Instance &#124; BindingFlags.Public);</p>
<p>        var gen = dynamicMethod.GetILGenerator();<br />
        var local = gen.DeclareLocal(type);<br />
        gen.Emit(OpCodes.Newobj, constructorInfo);<br />
        gen.Emit(OpCodes.Stloc, local);<br />
        foreach(var propertyInfo in propertyInfos)<br />
        {<br />
            var setterInfo = propertyInfo.GetSetMethod();<br />
            var getterInfo = propertyInfo.GetGetMethod();<br />
            if (setterInfo != null && getterInfo != null)<br />
            {<br />
                gen.Emit(OpCodes.Ldloc, local);<br />
                gen.Emit(OpCodes.Ldarg_0);<br />
                gen.Emit(OpCodes.Callvirt, getterInfo);<br />
                gen.Emit(OpCodes.Callvirt, setterInfo);<br />
            }<br />
        }<br />
        gen.Emit(OpCodes.Ldloc, local);<br />
        gen.Emit(OpCodes.Ret);</p>
<p>        return (Func<object, object>) dynamicMethod.CreateDelegate(typeof (Func<object, object>));<br />
    }<br />
}<br />
[/code]</p>
<p>Décortiquons une fois de plus la solution, en gardant à l'esprit que le but de l'article n'est pas d'apprendre à coder en CIL :</p>
<ul>
<li>Le membre <code>clonerLocator</code> est gardé en champ d'instance afin que l'on puisse le mémoizer.</li>
<li>Le constructeur s'occupe de cette tâche en faisant appel à la méthode d'extension <code>Memoize</code> dont vous pourrez (re)trouver la définition dans l'<a href="http://codingly.com/2008/05/02/optimisation-des-invocations-dynamiques-de-methodes-en-c/">article précédent</a>.</li>
<li>La méthode <code>Clone</code>, correspondant à l'implémentation de l'interface <code>ICloner</code>, se contente de récupérer via le locateur un délégué capable d'effectuer le clone de l'objet passé en paramètre. Elle l'invoque directement ensuite.</li>
<li>Le cœur de la solution réside donc dans la méthode <code>GetCloner</code> :
<ul>
<li>Une <a href="http://www.refactoring.com/catalog/replaceNestedConditionalWithGuardClauses.html">guard clause</a> permet de vérifier si le type de l'objet à créer expose bien un constructeur par défaut.</li>
<li>Une <code>DynamicMethod</code> est crée. Il s'agit d'une méthode prenant en paramètre un <code>object</code> et retournant un <code>object</code>, qui sera capable de cloner un objet du type <code>type</code></li>
<li>Grâce à la réflexion, on récupère les métadonnées de toutes les propriétés publiques du type <code>type</code>.</li>
<li>On récupère le générateur de code IL de la méthode dynamique afin de pouvoir émettre le corps de cette dernière.</li>
<li>On génère le code IL correspondant à la déclaration d'une variable locale de type <code>type</code>. On l'initialise avec une nouvelle instance de <code>type</code>.</li>
<li>On itère sur toutes les métadonnées des propriétés, et on ne considère que celles qui sont à la fois accessibles en lecture et en écriture.</li>
<li>A chaque fois que cette condition est vérifiée, on produit le code correspondant à l'affectation de la propriété du clone (appel au setter). La valeur utilisée pour l'affectation est celle récupérée par le getter sur la propriété de l'objet à cloner.</li>
<li>On termine la construction du corps de la <code>DynamicMethod</code> en émettant les instructions IL correspondant au retour du clone.</li>
<li>Enfin, la méthode <code>GetCloner</code> crée un délégué à partir de la méthode dynamique via <code>CreateDelegate</code>, et le renvoit.</li>
</ul>
</li>
</ul>
<p>C'est beau ! La mesure des performances en utilisant le même test que précédemment indique cette fois <strong>qu'un million de clones ont été créés en 305 ms</strong>. Pour information, la méthode <code>MemberwiseClone</code> donne un résultat de 234 ms.</p>
<h3>Conclusion</h3>
<p>La Lightweight Code Generation, et plus globalement l'utilisation de <code>Reflection.Emit</code>, permet d'apporter des solutions insoupçonnées à certains problèmes bien spécifiques. Cependant, elle n'est pas gratuite et demande un investissement non négligeable de la part de ceux qui veulent la maitriser ou bien même s'en servir ponctuellement. Les développements peuvent être nettement ralentis tandis que les phases de debug et de maintenance risquent de devenir critiques.</p>
<p>Il est donc surtout important de :</p>
<ul>
<li>Savoir que la technique existe.</li>
<li>Savoir reconnaitre les scénarios qui rendent son emploi envisageable.</li>
</ul>
<p>Il existe assez peu de bonnes ressources permettant d'apprendre à maitriser cette technique. Je suis en train de lire <a href="http://www.amazon.com/CIL-Programming-Under-Hood-NET/dp/1590590414">CIL Programming: Under the Hood of .NET</a> de <a href="http://www.jasonbock.net/JB">Jason Bock</a>, sans être spécialement séduit. Je conseille aux plus curieux de commencer par la MSDN et Google, puis de consulter les sources de projets qui utilisent l'émission de bytecode. Le blog de <a href="http://evain.net/blog/">Jean-Baptiste Evain</a> est également riche en infos au sujet du CIL : il est l'auteur entre autres de <a href="http://www.mono-project.com/Cecil">Mono.Cecil</a>.</p>
<p>Mais j'y reviendrai.</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Optimisation des invocations dynamiques de méthodes en C#]]></title>
<link>http://romainverdier.wordpress.com/?p=31</link>
<pubDate>Fri, 02 May 2008 20:52:51 +0000</pubDate>
<dc:creator>Romain Verdier</dc:creator>
<guid>http://romainverdier.wordpress.com/?p=31</guid>
<description><![CDATA[Je travaille actuellement en tant que consultant .NET sur un projet d&#8217;une certaine taille.
Tra]]></description>
<content:encoded><![CDATA[<p>Je travaille actuellement en tant que consultant .NET sur un projet d'une certaine taille.</p>
<p>Travailler sur un projet d'une certaine taille ne signifie pas forcément que l'on travaille sur un projet intéressant, mais ça augmente sensiblement les chances de rencontrer de nouveaux problèmes. Il n'est pas question aujourd'hui de définir ce qu'est un projet d'une certaine taille, ni même de démontrer le postulat précédent ; il s'agit plutôt de parler d'une des dernières problématiques auxquelles j'ai dû faire face :</p>
<p>Comment éviter que les <strong>invocations dynamiques de méthodes via la réflexion</strong> rendent les performances d'une application ou d'un module catastrophiques ?</p>
<p>Réponse : En minimisant l'utilisation de la réflexion. C'est ce que je vais tenter de développer à travers un exemple directement inspiré du projet réel, quoiqu'adapté pour les besoins de l'article. Le langage utilisé sera C# 3.0, mais rien n'empêche d'utiliser C# 2.0.<br />
<!--more--></p>
<h3>Invocation dynamique de méthodes</h3>
<p>Le langage C# supporte la <a href="http://msdn.microsoft.com/en-us/library/f7ykdhsy.aspx">réflexion</a>. Dès lors il est envisageable d'appeler dynamiquement des méthodes. La puissance de ce mécanisme est souvent contrebalancée par son coût. Prenons un exemple basique :</p>
<p>[code language='csharp']<br />
public void CallMethod(object target, string methodName)<br />
{<br />
    Type type = target.GetType();<br />
    MethodInfo methodInfo = type.GetMethod(methodName);<br />
    if (methodInfo != null)<br />
    {<br />
        methodInfo.Invoke(target, null);<br />
    }<br />
}<br />
[/code]</p>
<p>La fonction précédente est capable d'exécuter une méthode (sans valeur de retour ni paramètre) à partir de son nom, sur un objet donné. Cette implémentation est un désastre mais là n'est pas le vrai problème. Le vrai problème est inhérent aux <strong>performances</strong>. Essayons de nous concentrer sur ce qui coûte :</p>
<ul>
<li>L'appel à <code>GetType</code> pour récupérer le type de l'objet ne coûte quasiment rien. Nous pouvons considérer que la durée de son exécution est négligeable.</li>
<li>L'appel à <code>GetMethod</code> pour récupérer les métadonnées relatives à la méthode peut également être ignoré. Attention toutefois : le coût peut ici varier en fonction de la surcharge choisie pour <code>GetMethod</code>, et du type sur lequel on l'appelle.</li>
<li>L'appel à <code>Invoke</code> pour exécuter dynamiquement la méthode prend <strong>beaucoup de temps</strong>. En fait, c'est ce qui est le plus coûteux. Dans un simple test consistant à invoquer dynamiquement la méthode <code>Clone</code> sur une chaine de caractères, la durée d'exécution s'est avérée être plus de <strong>400 fois</strong> supérieure à celle nécessaire à un appel classique.</li>
</ul>
<p>Mais relativisons. Si vous êtes dans un scénario impliquant une seule invocation dynamique, vous n'allez sans doute jamais avoir à vous préoccuper des performances. Qu'un appel de méthode vous coûte 2 microsecondes au lieu de 4 nanosecondes n'est pas forcément dramatique ; en vérité, ça l'est rarement dans la plupart des applications.</p>
<p>Les scénarios critiques sont ceux qui vous forcent à utiliser la réflexion et l'invocation dynamique pour des tâches <strong>cruciales</strong> et <strong>récurrentes</strong>. Les petites microsecondes font les grandes décennies, etc.</p>
<p>Essayons donc de se mettre en situation en prenant un exemple un peu plus sérieux.</p>
<h3>Il nous faut la réflexion</h3>
<p>Admettons que le rôle d'un module clé de notre application soit de traiter un flux de données ; ces données étant des <a href="http://en.wikipedia.org/wiki/Data_Transfer_Object">DTO</a> quelconques. Une des tâches du module consiste à inspecter les propriétés de ces objets, ou plus précisément, à déterminer si la valeur courante de chaque propriété correspond à la valeur par défaut du type de la propriété.</p>
<p>Un test unitaire vaut 1000 mots. Voici celui qui valide (presque) le fonctionnement d'un composant capable d'effectuer la vérification dont nous venons de parler :</p>
<p>[code language='csharp']<br />
[Test]<br />
public void ShouldBeAbleToFindDefaultValues()<br />
{<br />
    IDefaultValueTester tester = CreateDefaultValueTester();</p>
<p>    Assert.IsFalse(tester.IsDefaultValue(typeof(int), 12));<br />
    Assert.IsTrue(tester.IsDefaultValue(typeof(int), 0));<br />
    Assert.IsTrue(tester.IsDefaultValue(typeof(double?), null));<br />
    Assert.IsTrue(tester.IsDefaultValue(typeof(string), null));<br />
    Assert.IsFalse(tester.IsDefaultValue(typeof(string), "test"));<br />
    Assert.IsFalse(tester.IsDefaultValue(typeof(DateTime), DateTime.Now));<br />
    Assert.IsTrue(tester.IsDefaultValue(typeof(DateTime), new DateTime()));<br />
}<br />
[/code]</p>
<p>L'interface <code>IDefaultValueTester</code> est simple :</p>
<p>[code language='csharp']<br />
public interface IDefaultValueTester<br />
{<br />
    bool IsDefaultValue(Type type, object value);<br />
}<br />
[/code]</p>
<p>L'objet de cet article n'est pas vraiment de trouver un moyen de faire passer ce test. Il existe d'ailleurs  une solution évidente, bien que peu élégante, qui consisterait à utiliser un switch-like. Mais il ne faut pas oublier qu'en .NET, un type peut être :</p>
<ul>
<li>Un type référence : <code>class</code>, <code>interface</code>.</li>
<li>Un type valeur : type de base (<code>int</code>, <code>double</code>, <code>bool</code>, etc.), <code>enum</code>, <code>struct</code>.</li>
<li>Un type <a href="http://blogs.msdn.com/ericgu/archive/2004/05/27/143221.aspx">nullable</a> : implémentation de la classe générique <code>Nullable&#60;T&#62;</code> (<code>int?</code>, <code>double?</code>, <code>bool?</code>, etc.)</li>
</ul>
<p>Dès lors, il est assez facile d'imaginer que le switch sera immonde, et pas forcément performant puisqu'il faudrait dans certains cas - je pense aux structures -  instancier des objets "templates" servant de base aux comparaisons.</p>
<p>J'ai pensé à une solution différente, basée sur les generics. Il est possible qu'il y ait encore plus malin, mais celle-ci a pour avantage de constituer un bon support pour cet article :</p>
<ul>
<li>Elle nécessite que l'on recoure à l'invocation dynamique de méthode.</li>
<li>Elle est lente, donc bonne candidate à l'optimisation.</li>
</ul>
<p>Le principe consiste à tirer partie du mot clé <code><a href="http://msdn.microsoft.com/en-us/library/xwth0h0d(VS.80).aspx">default</a></code> (capable de retourner la valeur par défaut d'un type) que l'on utilise souvent dans le contexte de la généricité. Voyons donc comment l'exploiter pour implémenter le cœur de cette solution :<br />
[code language='csharp']<br />
public static bool IsDefaultValue<T>(object value)<br />
{<br />
    var type = typeof(T);</p>
<p>    if (!type.IsValueType)<br />
        return value == null;</p>
<p>    if (value != null)<br />
        return value.Equals(default(T));</p>
<p>    if (type.IsGenericType && type.GetGenericTypeDefinition() == typeof(Nullable<>))<br />
        return true;</p>
<p>    var message = "The value type '{0}' can't be null.";<br />
    throw new ArgumentException(string.Format(message, type.Name));<br />
}<br />
[/code]</p>
<p>Tout le monde aura noté la subtile différence qu'il y a entre le prototype de cette méthode et celui de l'unique méthode <code>IsDefaultValue</code> de l'interface <code>IDefaultValueTester</code> : le type qui était passé sous la forme d'un objet de type <code>Type</code> se retrouve à présent en paramètre de type <code>T</code> d'une méthode générique. Et c'est là qu'interviennent la réflexion et l'invocation dynamique de méthode.</p>
<p>Examinons donc l'implémentation de <code>IDefaultValueTester</code> que je propose :</p>
<p>[code language='csharp']<br />
public class DefaultValueTester : IDefaultValueTester<br />
{<br />
    public bool IsDefaultValue(Type type, object value)<br />
    {<br />
        // On récupère les métadonnées de la méthode générique statique<br />
        // IsDefaultValue présente dans la classe courante.<br />
        var thisType = typeof(DefaultValueTester);<br />
        var methodInfo = thisType.GetMethod("IsDefaultValue",<br />
                                            BindingFlags.Static<br />
                                            &#124; BindingFlags.Public);</p>
<p>        // On lui spécifie au runtime son paramètre de type générique<br />
        methodInfo = methodInfo.MakeGenericMethod(type);</p>
<p>        // On invoque dynamiquement la méthode générique fermée<br />
        return (bool) methodInfo.Invoke(null, new [] {value});<br />
    }</p>
<p>    public static bool IsDefaultValue<T>(object value)<br />
    {<br />
        // cf. extrait de code précédent.<br />
    }<br />
}<br />
[/code]</p>
<p>La réflexion est donc nécessaire pour spécifier lors de l'exécution le paramètre de type de la méthode générique. Une fois la méthode fermée, on utilise <code>Invoke</code> pour l'exécuter dynamiquement. Résultat : le test passe. </p>
<p><img src="http://romainverdier.files.wordpress.com/2008/05/defaultvaluetestertest.png" alt="Résultats des tests unitaires" /></p>
<h3>Peut-on optimiser ?</h3>
<p>Oui, et heureusement. Car si on s'en tient à la description du contexte, il serait assez irresponsable d'utiliser ce <code>DefaultValueTester</code> au niveau du composant clé de notre architecture. Rappelons que ce dernier est censé inspecter les propriétés de tous les objets arrivant sur le flux. Si nous considérons qu'il s'agit d'un flux faisant parvenir au module des milliers d'objets par seconde, l'optimisation n'est plus une option.</p>
<p>Voici un nouveau test qui nous permet d'avoir une idée à propos des performances de la solution actuelle :</p>
<p>[code language='csharp']<br />
[Test]<br />
public void Test()<br />
{<br />
    var stopwatch = new Stopwatch();<br />
    const int iterationCount = 100000;<br />
    stopwatch.Start();</p>
<p>    IDefaultValueTester tester = CreateDefaultValueTester();<br />
    for (var i = 0; i < iterationCount; i++)<br />
    {<br />
        tester.IsDefaultValue(typeof(int), 12);<br />
        tester.IsDefaultValue(typeof(int), 0);<br />
        tester.IsDefaultValue(typeof(double?), null);<br />
        tester.IsDefaultValue(typeof(string), null);<br />
        tester.IsDefaultValue(typeof(string), "test");<br />
        tester.IsDefaultValue(typeof(DateTime), DateTime.Now);<br />
        tester.IsDefaultValue(typeof(DateTime), new DateTime());<br />
    }</p>
<p>    stopwatch.Stop();<br />
    Console.WriteLine(string.Format("{0} iteration(s) in {1} ms.",<br />
                                    iterationCount,<br />
                                    stopwatch.ElapsedMilliseconds));<br />
}<br />
[/code]</p>
<p>Les 100000 itérations ont été effectuées en <strong>10625 ms</strong>. C'est loin d'être terrible.</p>
<p>Il existe au moins deux façons différentes d'optimiser les invocations dynamiques de méthodes en C# dans un tel scénario. Les deux introduisent la notion de <strong>caching</strong> et se basent sur les <strong>délégués</strong>.</p>
<ol>
<li>Première solution :
<ul>
<li>Utiliser la <a href="http://msdn.microsoft.com/en-us/magazine/cc163759.aspx">Lightweight Code Generation (LCG)</a> via <code>Reflection.Emit</code> pour générer dynamiquement le code CIL correspondant à l'appel de la méthode générique <code>IsDefaultValue&#60;T&#62;</code> fermée sur le bon type.</li>
<li>Utiliser la méthode <code>CreateDelegate</code> de <code>DynamicMethod</code> pour récupérer un délégué pointant sur la méthode que l'on vient de générer.</li>
</ul>
</li>
<li>Seconde solution :
<ul>
<li>Conserver l'usage de la réflexion pour fermer le type de la méthode générique (appel à la méthode <code>MakeGenericMethod</code>) et récupérer le <code>MethodInfo</code> correspondant.</li>
<li>Utiliser la méthode statique <code>CreateDelegate</code> de la classe abstraite <code>Delegate</code> pour récupérer un délégué à partir du <code>MethodInfo</code> précédent.</li>
</ul>
</li>
</ol>
<p>Les délégués ainsi obtenus ont deux particularités qui les rendent précieux dans le contexte de cette optimisation :</p>
<ul>
<li>Le coût de leur invocation est quasiment nul, contrairement à l'appel à la méthode <code>Invoke</code> sur un <code>MethodInfo</code>.</li>
<li>Ils peuvent être mis en cache, et indexés intelligemment de façon à ce qu'ils ne soient pas recréés à chaque fois. Ici, il suffit d'utiliser le type des propriétés comme clé.</li>
</ul>
<p>Retenons ici la seconde solution, qui est plus simple à développer, maintenir et tester, et voyons ce que cela donne :<br />
[code language='csharp']<br />
using TesterMethodDelegate = Func<object, bool>;</p>
<p>public class OptimizedDefaultValueTester : IDefaultValueTester<br />
{<br />
    private readonly Dictionary<Type, TesterMethodDelegate> cache = new Dictionary<Type, TesterMethodDelegate>();</p>
<p>    public bool IsDefaultValue(Type type, object value)<br />
    {<br />
        var tester = GetTesterMethodDelegate(type, value);<br />
        return tester(value);<br />
    }</p>
<p>    private TesterMethodDelegate GetTesterMethodDelegate(Type type, object value)<br />
    {<br />
        TesterMethodDelegate tester;<br />
        if(!this.cache.TryGetValue(type, out tester))<br />
        {<br />
            var thisType = typeof(OptimizedDefaultValueTester);<br />
            var methodInfo = thisType.GetMethod("IsDefaultValue", BindingFlags.Static &#124; BindingFlags.Public);<br />
            methodInfo = methodInfo.MakeGenericMethod(type);<br />
            tester = (TesterMethodDelegate) Delegate.CreateDelegate(typeof(TesterMethodDelegate), methodInfo);<br />
            this.cache.Add(type, tester);<br />
        }<br />
        return tester;<br />
    }</p>
<p>    public static bool IsDefaultValue<T>(object obj)<br />
    {<br />
            // cf. extraits de code précédents.<br />
    }<br />
}<br />
[/code]</p>
<p>Les points remarquables :</p>
<ul>
<li>Ligne 1 : On utilise le type de délégué générique <code><a href="http://msdn.microsoft.com/en-us/library/bb549151.aspx">Func&#60;T,TReturn&#62;</a></code> du Framework 3.5, derrière un alias (<code>TesterMethodDelegate</code>).</li>
<li>Ligne 5 : Les instances de <code>TesterMethodDelegate</code> sont mises en cache grâce à un champ d'instance de type <code>Dictionary&#60;TKey,TValue&#62;</code> et sont indexées par type.</li>
<li>Ligne 16 : A chaque appel à <code>IsDefaultValue</code>, on regarde si un <code>TesterMethodDelegate</code> a déjà été créé pour le type passé en paramètre. Si c'est le cas, on récupère l'instance dans le cache, sinon, on la crée avant de l'ajouter au cache.</li>
<li>Ligne 10 : L'appel dynamique via la méthode <code>Invoke</code> a disparu, on invoque directement l'instance de <code>TesterMethodDelegate</code> récupérée.</li>
</ul>
<p>Toujours selon le même test, les performances sont améliorées. On passe de <strong>10625 ms</strong> pour 700000 appels, à <strong>506 ms</strong>. C'est environ 20 fois mieux, hourra.</p>
<h3>Peut-on aller plus loin ?</h3>
<p>Pas vraiment, si on ne considère que les performances. Par contre, il est possible d'encapsuler le mécanisme d'optimisation précédent pour favoriser la réutilisabilité. Et pour cela, nous pouvons utiliser la <a href="http://en.wikipedia.org/wiki/Memoization"><strong>memoization</strong></a>. Sans le savoir c'est un peu ce que nous avons imaginé jusqu'ici.</p>
<p>Cependant, il est possible en utilisant les <a href="http://msdn.microsoft.com/en-us/library/0yw3tz5k(vs.80).aspx">méthodes anonymes</a> (ou les <a href="http://msdn.microsoft.com/en-us/library/bb397687.aspx">expressions lambda</a> en C# 3.0) de mettre en place une solution plus élégante, et autorisant la réutilisation du caching comme s'il s'agissait en quelque sorte d'un <a href="http://en.wikipedia.org/wiki/Aspect_%28computer_science%29">aspect</a>. J'ai découvert cela en tombant sur ce <a href="http://blogs.msdn.com/wesdyer/archive/2007/01/26/function-memoization.aspx">post</a> et j'ai été séduit.</p>
<p>Le principe consiste à créer une méthode capable de retourner une version mémoizée d'un délégué. On peut même en faire une <a href="http://en.wikipedia.org/wiki/Extension_method">méthode d'extension</a> générique en C# 3.0:</p>
<p>[code language='csharp']<br />
public static class Memoization<br />
{<br />
    public static Func<T, TResult> Memoize<T, TResult>(this Func<T, TResult> function)<br />
    {<br />
        var cache = new Dictionary<T, TResult>();<br />
        var nullCache = default(TResult);<br />
        var isNullCacheSet = false;<br />
        return  parameter =><br />
                {<br />
                    TResult value;</p>
<p>                    if (parameter == null && isNullCacheSet)<br />
                    {<br />
                        return nullCache;<br />
                    }</p>
<p>                    if (parameter == null)<br />
                    {<br />
                        nullCache = function(parameter);<br />
                        isNullCacheSet = true;<br />
                        return nullCache;<br />
                    }</p>
<p>                    if (cache.TryGetValue(parameter, out value))<br />
                    {<br />
                        return value;<br />
                    }</p>
<p>                    value = function(parameter);<br />
                    cache.Add(parameter, value);<br />
                    return value;<br />
                };<br />
    }<br />
}<br />
[/code]</p>
<p>Décortiquons cette méthode :</p>
<ul>
<li>Elle prend en paramètre un délégué de type <code>Func&#60;T,TResult&#62;</code> et retourne un délégué du même type. Pour simplifier, on peut dire que la méthode d'extension prend en paramètre et retourne une fonction dont le prototype est le suivant : <code>TResult Function(T param)</code></li>
<li>La fonction retournée est construite via une expression lambda qui se charge d'encapsuler la logique de caching. Elle a pour rôle de mémoriser le résultat (de type <code>TResult</code>) de la fonction à chaque valeur différente de <code>T</code> pour laquelle on l'appelle.</li>
<li>C'est la valeur sauvegardée qui est retournée lorsqu'elle est présente dans le cache. En effet, le résultat de la fonction pour un paramètre donné ayant déjà été déterminé, il ne sert à rien d'exécuter de nouveau la fonction avec le même paramètre.</li>
<li>Dans cet exemple, l'expression lambda qui sert à créer la fonction retournée est une <a href="http://en.wikipedia.org/wiki/Closure_(computer_science)">closure</a>. C'est ici que réside toute l'ingéniosité de cette technique. Le dictionnaire est une variable locale à la méthode <code>Memoize</code> référencée par la méthode lambda, donc du point de vue de cette dernière l'état du cache sera conservé entre chaque appel.</li>
<li>La méthode doit traiter un cas particulier : Si la valeur <code>null</code> est passée en argument de la fonction, il n'est plus possible d'utiliser un dictionnaire pour mettre en cache le résultat puisque les clés de ce dernier ne peuvent être nulles. Nous utilisons donc une variable spécialement dédiée : <code>nullCache</code>.</li>
</ul>
<p>Bon, la memoization, c'est classe. Mais revenons à notre besoin. Quelle fonction a besoin d'être mémoizée ? Et bien tout simplement celle qui pour un type donné est capable de nous retourner le délégué pointant sur la bonne version fermée de <code>IsDefaultValue&#60;T&#62;</code>.</p>
<p>Une telle fonction peut avoir le prototype suivant :</p>
<p>[code language='csharp']<br />
Func<object, bool> GetTesterMethodDelegate(Type type);<br />
[/code]</p>
<p>Le type du délégué correspondant est le suivant :</p>
<p>[code language='csharp']<br />
Func<Type, Func<object, bool>><br />
[/code]</p>
<p>En effet, il s'agit bien d'une fonction qui prend un type en argument, et qui retourne une autre fonction prenant un objet en argument et retournant un booléen.</p>
<p>Il nous reste plus qu'à examiner la nouvelle implémentation de <code>IDefaultValueTester</code> qui se base sur le principe :</p>
<p>[code language='csharp']<br />
using TesterMethodDelegate = Func<object, bool>;<br />
using TesterMethodLocatorDelegate = Func<Type, Func<object, bool>>;</p>
<p>public class MemoizedDefaultValueTester : IDefaultValueTester<br />
{<br />
    private readonly TesterMethodLocatorDelegate testerLocator;</p>
<p>    public MemoizedDefaultValueTester()<br />
    {<br />
        // On crée une fonction capable de retourner la version fermée<br />
        // de la méthode IsDefaultValue<T> pour un type donné.<br />
        this.testerLocator = type =><br />
                             {<br />
                                 var thisType = typeof (OptimizedDefaultValueTester);<br />
                                 var methodInfo = thisType.GetMethod("IsDefaultValue", BindingFlags.Static &#124; BindingFlags.Public);<br />
                                 methodInfo = methodInfo.MakeGenericMethod(type);<br />
                                 var tester = (TesterMethodDelegate)Delegate.CreateDelegate(typeof(TesterMethodDelegate), methodInfo);<br />
                                 return tester;<br />
                             };</p>
<p>        // On mémomize cette fonction en appelant notre méthode d'extension<br />
        this.testerLocator = this.testerLocator.Memoize();<br />
    }</p>
<p>    public bool IsDefaultValue(Type type, object value)<br />
    {<br />
        var tester = this.testerLocator(type);<br />
        return tester(value);<br />
    }</p>
<p>    public static bool IsDefaultValue<T>(object obj)<br />
    {<br />
         // cf. extraits de code précédents.<br />
    }<br />
}<br />
[/code]</p>
<p>Nous pouvons constater que :</p>
<ul>
<li>Un nouvel alias (<code>TesterMethodLocatorDelegate</code>) est introduit pour le type générique <code>Func&#60;Type,Func&#60;object,bool&#62;&#62;</code> </li>
<li>La classe possède un champ d'instance (<code>testerLocator</code>) de type <code>TesterMethodLocatorDelegate</code> qui est initialisé dans le constructeur.</li>
<li>La méthode d'extension <code>Memoize</code> définie plus tôt est utilisée pour mémoizer le <code>TesterMethodLocatorDelegate</code>, toujours au niveau du constructeur.</li>
<li>L'implémentation de la méthode <code>IsDefaultValue</code> est extrêmement simplifiée. Via la version mémoizée du <code>TesterMethodLocatorDelegate</code>, on récupère un <code>TesterMethodDelegate</code> qui peut être invoqué directement afin d'effectuer le test sur la valeur passée en paramètre.</li>
</ul>
<p>Les performances de cette solution sont les mêmes que celles mesurées pour la précédente : environ <strong>510 ms</strong>. Mais à présent, nous disposons d'une méthode <code>Memoize</code> pouvant être réutilisée.</p>
<p>Hum. Attendez... Pourquoi ne pas la réutiliser alors, pour memoizer aussi les instances de <code>TesterMethodDelegate</code> retournées par le <code>TesterMethodLocatorDelegate</code> ? Il y aurait ainsi deux niveaux de mémoization, et peut-être à la clé un petit gain de performance supplémentaire.</p>
<p>La modification se limite donc à ajouter un nouvel appel à la méthode <code>Memoize</code> dans le constructeur du <code>MemoizedDefaultValueTester</code> :</p>
<p>[code language='csharp']<br />
public MemoizedDefaultValueTester()<br />
{<br />
    // On crée une fonction capable de retourner la version fermée<br />
    // de la méthode IsDefaultValue<T> pour un type donné.<br />
    this.testerLocator = type =><br />
                         {<br />
                             var thisType = typeof (OptimizedDefaultValueTester);<br />
                             var methodInfo = thisType.GetMethod("IsDefaultValue", BindingFlags.Static &#124; BindingFlags.Public);<br />
                             methodInfo = methodInfo.MakeGenericMethod(type);<br />
                             var tester = (TesterMethodDelegate)Delegate.CreateDelegate(typeof(TesterMethodDelegate), methodInfo);</p>
<p>                             // On retourne à présent une version mémoizée du TesterMethodDelegate :<br />
                             return tester.Memoize();<br />
                         };</p>
<p>    // On mémoize cette fonction en appelant notre méthode d'extension<br />
    this.testerLocator = this.testerLocator.Memoize();<br />
}<br />
[/code]</p>
<p>Le test des performances indique à présent que les 100000 itérations ont eu lieu en <strong>320 ms</strong> ! Ce n'est pas aussi efficace que la première étape d'optimisation, mais proportionnellement cela conduit tout de même à une amélioration significative : environ 30%.</p>
<p><strong>Attention</strong> quand même : Si notre premier usage de la memoization était justifié, le second peut être très dangereux. <a href="http://en.wikipedia.org/wiki/Computational_complexity_theory">Nous gagnons des millisecondes, mais nous perdons des octets</a>. Et dans le scénario actuel, il est même probable que la memoization des <code>TesterMethodDelegate</code> conduise à une <code>OutOfMemoryException</code> rapidement...</p>
<h3>Conclusion</h3>
<p>Nous nous sommes contentés d'évoquer la solution d'optimisation impliquant la génération de code IL. Dans le contexte de la problématique discutée, elle n'offrait aucun avantage par rapport à celle que nous avons exposée. Pire, elle imposait une étape inutile. Toutefois, certains besoins plus complexes dépassent le cadre des invocations dynamiques de méthodes et peuvent tout de même être adressés efficacement en recourant à la génération de bytecode. Je pense que cela sera le sujet d'un prochain article.</p>
<p>Quant à la technique détaillée dans celui-ci, elle est simple et permet d'obtenir des performances acceptables dans la majorité des scénarios pour lesquels l'utilisation de la réflexion est nécessaire.</p>
<p>Cela fait presque deux raisons de ne plus avoir systématiquement peur de la réflexion. Par contre, si vous n'en avez pas peur du tout, il serait peut-être temps de s'y mettre doucement...</p>
<div class="post-edited-notification">
<strong>Edit </strong>: Un <a href="http://codingly.com/2008/05/06/continuer-loptimisation-avec-la-lightweight-code-generation-lcg/">autre article</a> complète à présent celui-ci.
</div>
]]></content:encoded>
</item>

</channel>
</rss>
