Whamcloud - gitweb
b=15712:
[fs/lustre-release.git] / lnet / ChangeLog
index f0756ad..40d3075 100644 (file)
-2007-04-23  Cluster File Systems, Inc. <info@clusterfs.com>
-       * version 1.4.11 / 1.6.1
+tbd  Sun Microsystems, Inc.
+       * version 1.6.6
+       * Support for networks:
+        socklnd   - any kernel supported by Lustre,
+        qswlnd    - Qsnet kernel modules 5.20 and later,
+        openiblnd - IbGold 1.8.2,
+        o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5
+        viblnd    - Voltaire ibhost 3.4.5 and later,
+        ciblnd    - Topspin 3.2.0,
+        iiblnd    - Infiniserv 3.3 + PathBits patch,
+        gmlnd     - GM 2.1.22 and later,
+        mxlnd     - MX 1.2.1 or later,
+        ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+
+Severity   : 
+Bugzilla   : 
+Description: 
+Details    : 
+
+
+-------------------------------------------------------------------------------
+
+
+04-26-2008  Sun Microsystems, Inc.
+       * version 1.6.5
        * Support for networks:
-       socklnd   - kernels up to 2.6.16
-       qswlnd    - Qsnet kernel modules 5.20 and later
-       openiblnd - IbGold 1.8.2
+       socklnd   - any kernel supported by Lustre,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
+       ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+
+Severity   : major
+Bugzilla   : 15712
+Description: ksocknal_create_conn() hit ASSERTION during connection race
+Details    : ksocknal_create_conn() hit ASSERTION during connection race
+
+Severity   : major
+Bugzilla   : 13983
+Description: ksocknal_send_hello() hit ASSERTION while connecting race
+Details    : ksocknal_send_hello() hit ASSERTION while connecting race
+
+Severity   : major
+Bugzilla   : 14425
+Description: o2iblnd/ptllnd credit deadlock in a routed config.
+Details    : o2iblnd/ptllnd credit deadlock in a routed config.
+
+Severity   : normal
+Bugzilla   : 14956
+Description: High load after starting lnet
+Details    : gmlnd should sleep in rx thread in interruptible way. Otherwise,
+            uptime utility reports high load that looks confusingly.
+
+Severity   : normal
+Bugzilla   : 14838
+Description: ksocklnd fails to establish connection if accept_port is high
+Details    : PID remapping must not be done for active (outgoing) connections
+
+--------------------------------------------------------------------------------
+
+2008-01-11  Sun Microsystems, Inc.
+       * version 1.4.12
+       * Support for networks:
+       socklnd   - any kernel supported by Lustre,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
+       ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+Severity   : normal
+Bugzilla   : 14387
+Description: liblustre network error
+Details    : liblustre clients should understand LNET_ACCEPT_PORT environment
+            variable even if they don't start lnet acceptor.
+
+Severity   : normal
+Bugzilla   : 14300
+Description: Strange message from lnet (Ignoring prediction from the future)
+Details    : Incorrect calculation of peer's last_alive value in ksocklnd
+
+--------------------------------------------------------------------------------
+
+2007-12-07         Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.6.4
+       * Support for networks:
+       socklnd   - any kernel supported by Lustre,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5.
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
+       ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+
+Severity   : normal
+Bugzilla   : 14238
+Description: ASSERTION(me == md->md_me) failed in lnet_match_md()
+
+Severity   : normal
+Bugzilla   : 12494
+Description: increase send queue size for ciblnd/openiblnd
+
+Severity   : normal
+Bugzilla   : 12302
+Description: new userspace socklnd
+Details    : Old userspace tcpnal that resided in lnet/ulnds/socklnd replaced
+             with new one - usocklnd.
+
+Severity   : enhancement
+Bugzilla   : 11686
+Description: Console message flood
+Details    : Make cdls ratelimiting more tunable by adding several tunable in
+            procfs /proc/sys/lnet/console_{min,max}_delay_centisecs and
+            /proc/sys/lnet/console_backoff.
+
+--------------------------------------------------------------------------------
+
+2007-09-27         Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.6.3
+       * Support for networks:
+       socklnd   - any kernel supported by Lustre,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1 and 1.2,
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
+       ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+
+Severity   : normal
+Bugzilla   : 12782
+Description: /proc/sys/lnet has non-sysctl entries
+Details    : Updating dump_kernel/daemon_file/debug_mb to use sysctl variables
+
+Severity   : major
+Bugzilla   : 13236
+Description: TOE Kernel panic by ksocklnd
+Details    : offloaded sockets provide their own implementation of sendpage,
+             can't call tcp_sendpage() directly
+
+Severity   : normal
+Bugzilla   : 10778
+Description: kibnal_shutdown() doesn't finish; lconf --cleanup hangs
+Details    : races between lnd_shutdown and peer creation prevent 
+             lnd_shutdown from finishing.
+
+Severity   : normal
+Bugzilla   : 13279
+Description: open files rlimit 1024 reached while liblustre testing
+Details    : ulnds/socklnd must close open socket after unsuccessful
+             'say hello' attempt.
+
+Severity   : major 
+Bugzilla   : 13482
+Description: build error
+Details    : fix typos in gmlnd, ptllnd and viblnd
+
+------------------------------------------------------------------------------
+
+2007-07-30  Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.6.1
+       * Support for networks:
+       socklnd   - kernels up to 2.6.16,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1 and 1.2
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
+       ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
+
+2007-06-21  Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.4.11
+       * Support for networks:
+       socklnd   - kernels up to 2.6.16,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
        o2iblnd   - OFED 1.1
-       viblnd    - Voltaire ibhost 3.4.5 and later
-       ciblnd    - Topspin 3.2.0
-       iiblnd    - Infiniserv 3.3 + PathBits patch
-       gmlnd     - GM 2.1.22 and later
-       mxlnd     - MX 1.2.1 or later
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
        ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
-       * bug fixes
+
+Severity   : minor
+Bugzilla   : 13288
+Description: Initialize cpumask before use
+
+Severity   : major
+Bugzilla   : 12014
+Description: ASSERTION failures when upgrading to the patchless zero-copy
+             socklnd 
+Details    : This bug affects "rolling upgrades", causing an inconsistent
+             protocol version negotiation and subsequent assertion failure
+            during rolling upgrades after the first wave of upgrades.
+
+Severity   : minor
+Bugzilla   : 11223
+Details    : Change "dropped message" CERRORs to D_NETERROR so they are
+             logged instead of creating "console chatter" when a lustre
+            timeout races with normal RPC completion.
+
+Severity   : minor
+Details    : lnet_clear_peer_table can wait forever if user forgets to
+             clear a lazy portal.
+
+Severity   : minor
+Details    : libcfs_id2str should check pid against LNET_PID_ANY.
+
+Severity   : major
+Bugzilla   : 10916
+Description: added LNET self test
+Details    : landing b_self_test
+
+Severity   : minor
+Frequency  : rare
+Bugzilla   : 12227
+Description: cfs_duration_{u,n}sec() wrongly calculate nanosecond part of
+            struct timeval.
+Details    : do_div() macro is used incorrectly.
+
+2007-04-23  Cluster File Systems, Inc. <info@clusterfs.com>
+
+Severity   : normal
+Bugzilla   : 11680
+Description: make panic on lbug configurable
+
+Severity   : major
+Bugzilla   : 12316
+Description: Add OFED1.2 support to o2iblnd
+Details    : o2iblnd depends on OFED's modules, if out-tree OFED's modules
+             are installed (other than kernel's in-tree infiniband), there
+             could be some problem while insmod o2iblnd (mismatch CRC of 
+             ib_* symbols).
+             If extra Module.symvers is supported in kernel (i.e, 2.6.17),
+             this link provides solution:
+             https://bugs.openfabrics.org/show_bug.cgi?id=355
+             if extra Module.symvers is not supported in kernel, we will
+             have to run the script in bug 12316 to update
+             $LINUX/module.symvers before building o2iblnd.
+             More details about this are in bug 12316.
 
 ------------------------------------------------------------------------------
 
 2007-04-01  Cluster File Systems, Inc. <info@clusterfs.com>
        * version 1.4.10 / 1.6.0
        * Support for networks:
-       socklnd   - kernels up to 2.6.16
-       qswlnd    - Qsnet kernel modules 5.20 and later
-       openiblnd - IbGold 1.8.2
-       o2iblnd   - OFED 1.1
-       viblnd    - Voltaire ibhost 3.4.5 and later
-       ciblnd    - Topspin 3.2.0
-       iiblnd    - Infiniserv 3.3 + PathBits patch
-       gmlnd     - GM 2.1.22 and later
-       mxlnd     - MX 1.2.1 or later
+       socklnd   - kernels up to 2.6.16,
+       qswlnd    - Qsnet kernel modules 5.20 and later,
+       openiblnd - IbGold 1.8.2,
+       o2iblnd   - OFED 1.1,
+       viblnd    - Voltaire ibhost 3.4.5 and later,
+       ciblnd    - Topspin 3.2.0,
+       iiblnd    - Infiniserv 3.3 + PathBits patch,
+       gmlnd     - GM 2.1.22 and later,
+       mxlnd     - MX 1.2.1 or later,
        ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
-       * bug fixes
+       
+Severity   : minor
+Frequency  : rare
+Description: Ptllnd didn't init kptllnd_data.kptl_idle_txs before it could be
+            possibly accessed in kptllnd_shutdown. Ptllnd should init 
+            kptllnd_data.kptl_ptlid2str_lock before calling kptllnd_ptlid2str.
+
+Severity   : normal
+Frequency  : rare
+Description: gmlnd ignored some transmit errors when finalizing lnet messages.
+
+Severity   : minor
+Frequency  : rare
+Description: ptllnd logs a piece of incorrect debug info in kptllnd_peer_handle_hello.
 
+Severity   : minor
+Frequency  : rare
+Description: the_lnet.ln_finalizing was not set when the current thread is
+             about to complete messages. It only affects multi-threaded 
+            user space LNet.
+       
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 11472
+Description: Changed the default kqswlnd ntxmsg=512
+       
 Severity   : major
 Frequency  : rare
 Bugzilla   : 12458
@@ -38,7 +305,7 @@ Description: Assertion failure in kernel ptllnd caused by posting passive
        
 Severity   : major
 Frequency  : rare
-Bugzilla   : 12455
+Bugzilla   : 12445
 Description: A race in kernel ptllnd between deleting a peer and posting
              new communications for it could hang communications -
             manifesting as "Unexpectedly long timeout" messages.