Whamcloud - gitweb
Reverting the changes
[fs/lustre-release.git] / lnet / ChangeLog
1 tbd  Sun Microsystems, Inc.
2         * version 1.6.6
3         * Support for networks:
4          socklnd   - any kernel supported by Lustre,
5          qswlnd    - Qsnet kernel modules 5.20 and later,
6          openiblnd - IbGold 1.8.2,
7          o2iblnd   - OFED 1.1, 1.2.0, 1.2.5, and 1.3
8          viblnd    - Voltaire ibhost 3.4.5 and later,
9          ciblnd    - Topspin 3.2.0,
10          iiblnd    - Infiniserv 3.3 + PathBits patch,
11          gmlnd     - GM 2.1.22 and later,
12          mxlnd     - MX 1.2.1 or later,
13          ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
14
15 Severity   : 
16 Bugzilla   : 
17 Description: 
18 Details    : 
19
20 Severity   : major
21 Bugzilla   : 15983
22 Description: workaround for OOM from o2iblnd
23 Details    : OFED needs allocate big chunk of memory for QP while creating
24              connection for o2iblnd, OOM can happen if no such a contiguous
25              memory chunk.
26              QP size is decided by concurrent_sends and max_fragments of
27              o2iblnd, now we permit user to specify smaller value for
28              concurrent_sends of o2iblnd(i.e: concurrent_sends=7), which
29              will decrease memory block size required by creating QP.
30
31 Severity   : major
32 Bugzilla   : 15093
33 Description: Support Zerocopy receive of Chelsio device
34 Details    : Chelsio driver can support zerocopy for iov[1] if it's
35              contiguous and large enough.
36
37 Severity   : normal
38 Bugzilla   : 13490
39 Description: fix credit flow deadlock in uptllnd
40
41 Severity   : normal
42 Bugzilla   : 16308
43 Description: finalize network operation in reasonable time
44 Details    : conf-sanity test_32a couldn't stop ost and mds because it
45              tried to access non-existent peer and tcp connect took
46              quite long before timing out.
47
48 Severity   : normal
49 Bugzilla   : 13139
50 Description: Remove portals compatibility
51 Details    : Remove portals compatibility, not interoperable with releases
52              before 1.4.6
53
54 Severity   : major
55 Bugzilla   : 16338
56 Description: Continuous recovery on 33 of 413 nodes after lustre oss failure
57 Details    : Lost reference on conn prevents peer from being destroyed, which
58              could prevent new peer creation if peer count has reached upper
59              limit.
60
61 Severity   : normal
62 Bugzilla   : 16102
63 Description: LNET Selftest results in Soft lockup on OSS CPU
64 Details    : only hits when 8 or more o2ib clients involved and a session is
65              torn down with 'lst end_session' without preceeding 'lst stop'.
66
67 Severity   : minor
68 Bugzilla   : 16321
69 Description: concurrent_sends in IB LNDs should not be changeable at run time
70 Details    : concurrent_sends in IB LNDs should not be changeable at run time
71
72 Severity   : normal
73 Bugzilla   : 15272
74 Description: ptl_send_rpc hits LASSERT when ptl_send_buf fails
75 Details    : only hits under out-of-memory situations
76
77
78 -------------------------------------------------------------------------------
79
80
81 04-26-2008  Sun Microsystems, Inc.
82        * version 1.6.5
83        * Support for networks:
84         socklnd   - any kernel supported by Lustre,
85         qswlnd    - Qsnet kernel modules 5.20 and later,
86         openiblnd - IbGold 1.8.2,
87         o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5
88         viblnd    - Voltaire ibhost 3.4.5 and later,
89         ciblnd    - Topspin 3.2.0,
90         iiblnd    - Infiniserv 3.3 + PathBits patch,
91         gmlnd     - GM 2.1.22 and later,
92         mxlnd     - MX 1.2.1 or later,
93         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
94
95 Severity   : normal
96 Bugzilla   : 14322
97 Description: excessive debug information removed
98 Details    : excessive debug information removed
99
100 Severity   : major
101 Bugzilla   : 15712
102 Description: ksocknal_create_conn() hit ASSERTION during connection race
103 Details    : ksocknal_create_conn() hit ASSERTION during connection race
104
105 Severity   : major
106 Bugzilla   : 13983
107 Description: ksocknal_send_hello() hit ASSERTION while connecting race
108 Details    : ksocknal_send_hello() hit ASSERTION while connecting race
109
110 Severity   : major
111 Bugzilla   : 14425
112 Description: o2iblnd/ptllnd credit deadlock in a routed config.
113 Details    : o2iblnd/ptllnd credit deadlock in a routed config.
114
115 Severity   : normal
116 Bugzilla   : 14956
117 Description: High load after starting lnet
118 Details    : gmlnd should sleep in rx thread in interruptible way. Otherwise,
119              uptime utility reports high load that looks confusingly.
120
121 Severity   : normal
122 Bugzilla   : 14838
123 Description: ksocklnd fails to establish connection if accept_port is high
124 Details    : PID remapping must not be done for active (outgoing) connections
125
126 --------------------------------------------------------------------------------
127
128 2008-01-11  Sun Microsystems, Inc.
129        * version 1.4.12
130        * Support for networks:
131         socklnd   - any kernel supported by Lustre,
132         qswlnd    - Qsnet kernel modules 5.20 and later,
133         openiblnd - IbGold 1.8.2,
134         o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5
135         viblnd    - Voltaire ibhost 3.4.5 and later,
136         ciblnd    - Topspin 3.2.0,
137         iiblnd    - Infiniserv 3.3 + PathBits patch,
138         gmlnd     - GM 2.1.22 and later,
139         mxlnd     - MX 1.2.1 or later,
140         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
141 Severity   : normal
142 Bugzilla   : 14387
143 Description: liblustre network error
144 Details    : liblustre clients should understand LNET_ACCEPT_PORT environment
145              variable even if they don't start lnet acceptor.
146
147 Severity   : normal
148 Bugzilla   : 14300
149 Description: Strange message from lnet (Ignoring prediction from the future)
150 Details    : Incorrect calculation of peer's last_alive value in ksocklnd
151
152 --------------------------------------------------------------------------------
153
154 2007-12-07         Cluster File Systems, Inc. <info@clusterfs.com>
155        * version 1.6.4
156        * Support for networks:
157         socklnd   - any kernel supported by Lustre,
158         qswlnd    - Qsnet kernel modules 5.20 and later,
159         openiblnd - IbGold 1.8.2,
160         o2iblnd   - OFED 1.1 and 1.2.0, 1.2.5.
161         viblnd    - Voltaire ibhost 3.4.5 and later,
162         ciblnd    - Topspin 3.2.0,
163         iiblnd    - Infiniserv 3.3 + PathBits patch,
164         gmlnd     - GM 2.1.22 and later,
165         mxlnd     - MX 1.2.1 or later,
166         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
167
168 Severity   : normal
169 Bugzilla   : 14238
170 Description: ASSERTION(me == md->md_me) failed in lnet_match_md()
171
172 Severity   : normal
173 Bugzilla   : 12494
174 Description: increase send queue size for ciblnd/openiblnd
175
176 Severity   : normal
177 Bugzilla   : 12302
178 Description: new userspace socklnd
179 Details    : Old userspace tcpnal that resided in lnet/ulnds/socklnd replaced
180              with new one - usocklnd.
181
182 Severity   : enhancement
183 Bugzilla   : 11686
184 Description: Console message flood
185 Details    : Make cdls ratelimiting more tunable by adding several tunable in
186              procfs /proc/sys/lnet/console_{min,max}_delay_centisecs and
187              /proc/sys/lnet/console_backoff.
188
189 --------------------------------------------------------------------------------
190
191 2007-09-27         Cluster File Systems, Inc. <info@clusterfs.com>
192        * version 1.6.3
193        * Support for networks:
194         socklnd   - any kernel supported by Lustre,
195         qswlnd    - Qsnet kernel modules 5.20 and later,
196         openiblnd - IbGold 1.8.2,
197         o2iblnd   - OFED 1.1 and 1.2,
198         viblnd    - Voltaire ibhost 3.4.5 and later,
199         ciblnd    - Topspin 3.2.0,
200         iiblnd    - Infiniserv 3.3 + PathBits patch,
201         gmlnd     - GM 2.1.22 and later,
202         mxlnd     - MX 1.2.1 or later,
203         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
204
205 Severity   : normal
206 Bugzilla   : 12782
207 Description: /proc/sys/lnet has non-sysctl entries
208 Details    : Updating dump_kernel/daemon_file/debug_mb to use sysctl variables
209
210 Severity   : major
211 Bugzilla   : 13236
212 Description: TOE Kernel panic by ksocklnd
213 Details    : offloaded sockets provide their own implementation of sendpage,
214              can't call tcp_sendpage() directly
215
216 Severity   : normal
217 Bugzilla   : 10778
218 Description: kibnal_shutdown() doesn't finish; lconf --cleanup hangs
219 Details    : races between lnd_shutdown and peer creation prevent 
220              lnd_shutdown from finishing.
221
222 Severity   : normal
223 Bugzilla   : 13279
224 Description: open files rlimit 1024 reached while liblustre testing
225 Details    : ulnds/socklnd must close open socket after unsuccessful
226              'say hello' attempt.
227
228 Severity   : major 
229 Bugzilla   : 13482
230 Description: build error
231 Details    : fix typos in gmlnd, ptllnd and viblnd
232
233 ------------------------------------------------------------------------------
234
235 2007-07-30  Cluster File Systems, Inc. <info@clusterfs.com>
236        * version 1.6.1
237        * Support for networks:
238         socklnd   - kernels up to 2.6.16,
239         qswlnd    - Qsnet kernel modules 5.20 and later,
240         openiblnd - IbGold 1.8.2,
241         o2iblnd   - OFED 1.1 and 1.2
242         viblnd    - Voltaire ibhost 3.4.5 and later,
243         ciblnd    - Topspin 3.2.0,
244         iiblnd    - Infiniserv 3.3 + PathBits patch,
245         gmlnd     - GM 2.1.22 and later,
246         mxlnd     - MX 1.2.1 or later,
247         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
248
249 2007-06-21  Cluster File Systems, Inc. <info@clusterfs.com>
250        * version 1.4.11
251        * Support for networks:
252         socklnd   - kernels up to 2.6.16,
253         qswlnd    - Qsnet kernel modules 5.20 and later,
254         openiblnd - IbGold 1.8.2,
255         o2iblnd   - OFED 1.1
256         viblnd    - Voltaire ibhost 3.4.5 and later,
257         ciblnd    - Topspin 3.2.0,
258         iiblnd    - Infiniserv 3.3 + PathBits patch,
259         gmlnd     - GM 2.1.22 and later,
260         mxlnd     - MX 1.2.1 or later,
261         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
262
263 Severity   : minor
264 Bugzilla   : 13288
265 Description: Initialize cpumask before use
266
267 Severity   : major
268 Bugzilla   : 12014
269 Description: ASSERTION failures when upgrading to the patchless zero-copy
270              socklnd 
271 Details    : This bug affects "rolling upgrades", causing an inconsistent
272              protocol version negotiation and subsequent assertion failure
273              during rolling upgrades after the first wave of upgrades.
274
275 Severity   : minor
276 Bugzilla   : 11223
277 Details    : Change "dropped message" CERRORs to D_NETERROR so they are
278              logged instead of creating "console chatter" when a lustre
279              timeout races with normal RPC completion.
280
281 Severity   : minor
282 Details    : lnet_clear_peer_table can wait forever if user forgets to
283              clear a lazy portal.
284
285 Severity   : minor
286 Details    : libcfs_id2str should check pid against LNET_PID_ANY.
287
288 Severity   : major
289 Bugzilla   : 10916
290 Description: added LNET self test
291 Details    : landing b_self_test
292
293 Severity   : minor
294 Frequency  : rare
295 Bugzilla   : 12227
296 Description: cfs_duration_{u,n}sec() wrongly calculate nanosecond part of
297              struct timeval.
298 Details    : do_div() macro is used incorrectly.
299
300 2007-04-23  Cluster File Systems, Inc. <info@clusterfs.com>
301
302 Severity   : normal
303 Bugzilla   : 11680
304 Description: make panic on lbug configurable
305
306 Severity   : major
307 Bugzilla   : 12316
308 Description: Add OFED1.2 support to o2iblnd
309 Details    : o2iblnd depends on OFED's modules, if out-tree OFED's modules
310              are installed (other than kernel's in-tree infiniband), there
311              could be some problem while insmod o2iblnd (mismatch CRC of 
312              ib_* symbols).
313              If extra Module.symvers is supported in kernel (i.e, 2.6.17),
314              this link provides solution:
315              https://bugs.openfabrics.org/show_bug.cgi?id=355
316              if extra Module.symvers is not supported in kernel, we will
317              have to run the script in bug 12316 to update
318              $LINUX/module.symvers before building o2iblnd.
319              More details about this are in bug 12316.
320
321 ------------------------------------------------------------------------------
322
323 2007-04-01  Cluster File Systems, Inc. <info@clusterfs.com>
324        * version 1.4.10 / 1.6.0
325        * Support for networks:
326         socklnd   - kernels up to 2.6.16,
327         qswlnd    - Qsnet kernel modules 5.20 and later,
328         openiblnd - IbGold 1.8.2,
329         o2iblnd   - OFED 1.1,
330         viblnd    - Voltaire ibhost 3.4.5 and later,
331         ciblnd    - Topspin 3.2.0,
332         iiblnd    - Infiniserv 3.3 + PathBits patch,
333         gmlnd     - GM 2.1.22 and later,
334         mxlnd     - MX 1.2.1 or later,
335         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
336         
337 Severity   : minor
338 Frequency  : rare
339 Description: Ptllnd didn't init kptllnd_data.kptl_idle_txs before it could be
340              possibly accessed in kptllnd_shutdown. Ptllnd should init 
341              kptllnd_data.kptl_ptlid2str_lock before calling kptllnd_ptlid2str.
342
343 Severity   : normal
344 Frequency  : rare
345 Description: gmlnd ignored some transmit errors when finalizing lnet messages.
346
347 Severity   : minor
348 Frequency  : rare
349 Description: ptllnd logs a piece of incorrect debug info in kptllnd_peer_handle_hello.
350
351 Severity   : minor
352 Frequency  : rare
353 Description: the_lnet.ln_finalizing was not set when the current thread is
354              about to complete messages. It only affects multi-threaded 
355              user space LNet.
356         
357 Severity   : normal
358 Frequency  : rare
359 Bugzilla   : 11472
360 Description: Changed the default kqswlnd ntxmsg=512
361         
362 Severity   : major
363 Frequency  : rare
364 Bugzilla   : 12458
365 Description: Assertion failure in kernel ptllnd caused by posting passive
366              bulk buffers before connection establishment complete.
367         
368 Severity   : major
369 Frequency  : rare
370 Bugzilla   : 12445
371 Description: A race in kernel ptllnd between deleting a peer and posting
372              new communications for it could hang communications -
373              manifesting as "Unexpectedly long timeout" messages.
374         
375 Severity   : major
376 Frequency  : rare
377 Bugzilla   : 12432
378 Description: Kernel ptllnd lock ordering issue could hang a node.
379         
380 Severity   : major
381 Frequency  : rare
382 Bugzilla   : 12016
383 Description: node crash on socket teardown race
384
385 Severity   : minor
386 Frequency  : 'lctl peer_list' issued on a mx net
387 Bugzilla   : 12237
388 Description: Enable lctl's peer_list for MXLND
389
390 Severity   : major
391 Frequency  : after Ptllnd timeouts and portals congestion
392 Bugzilla   : 11659
393 Description: Credit overflows
394 Details    : This was a bug in ptllnd connection establishment.  The fix
395              implements better peer stamps to disambiguate connection
396              establishment and ensure both peers enter the credit flow
397              state machine consistently.
398
399 Severity   : major
400 Frequency  : rare       
401 Bugzilla   : 11394
402 Description: kptllnd didn't propagate some network errors up to LNET 
403 Details    : This bug was spotted while investigating 11394.  The fix
404              ensures network errors on sends and bulk transfers are
405              propagated to LNET/lustre correctly.
406
407 Severity   : enhancement
408 Bugzilla   : 10316
409 Description: Fixed console chatter in case of -ETIMEDOUT.
410
411 Severity   : enhancement
412 Bugzilla   : 11684
413 Description: Added D_NETTRACE for recording network packet history
414              (initially only for ptllnd).  Also a separate userspace
415              ptllnd facility to gather history which should really be
416              covered by D_NETTRACE too, if only CDEBUG recorded history in
417              userspace.
418
419 Severity   : major
420 Frequency  : rare       
421 Bugzilla   : 11616
422 Description: o2iblnd handle early RDMA_CM_EVENT_DISCONNECTED.
423 Details    : If the fabric is lossy, an RDMA_CM_EVENT_DISCONNECTED
424              callback can occur before a connection has actually been
425              established.  This caused an assertion failure previously.
426
427 Severity   : enhancement
428 Bugzilla   : 11094
429 Description: Multiple instances for o2iblnd
430 Details    : Allow multiple instances of o2iblnd to enable networking over
431              multiple HCAs and routing between them.
432
433 Severity   : major
434 Bugzilla   : 11201
435 Description: lnet deadlock in router_checker
436 Details    : turned ksnd_connd_lock, ksnd_reaper_lock, and ksock_net_t:ksnd_lock
437              into BH locks to eliminate potential deadlock caused by
438              ksocknal_data_ready() preempting code holding these locks.
439
440 Severity   : major
441 Bugzilla   : 11126
442 Description: Millions of failed socklnd connection attempts cause a very slow FS
443 Details    : added a new route flag ksnr_scheduled to distinguish from
444              ksnr_connecting, so that a peer connection request is only turned
445              down for race concerns when an active connection to the same peer
446              is under progress (instead of just being scheduled).
447
448 ------------------------------------------------------------------------------
449
450 2007-02-09  Cluster File Systems, Inc. <info@clusterfs.com>
451        * version 1.4.9
452        * Support for networks:
453         socklnd   - kernels up to 2.6.16
454         qswlnd    - Qsnet kernel modules 5.20 and later
455         openiblnd - IbGold 1.8.2
456         o2iblnd   - OFED 1.1
457         viblnd    - Voltaire ibhost 3.4.5 and later
458         ciblnd    - Topspin 3.2.0
459         iiblnd    - Infiniserv 3.3 + PathBits patch
460         gmlnd     - GM 2.1.22 and later
461         mxlnd     - MX 1.2.1 or later
462         ptllnd    - Portals 3.3 / UNICOS/lc 1.5.x, 2.0.x
463        * bug fixes
464
465 Severity   : major on XT3
466 Bugzilla   : none
467 Description: libcfs overwrites /proc/sys/portals
468 Details    : libcfs created a symlink from /proc/sys/portals to
469              /proc/sys/lnet for backwards compatibility.  This is no
470              longer required and makes the Cray portals /proc variables
471              inaccessible.
472
473 Severity   : minor
474 Bugzilla   : 11312
475 Description: OFED FMR API change
476 Details    : This changes parameter usage to reflect a change in
477              ib_fmr_pool_map_phys() between OFED 1.0 and OFED 1.1.  Note
478              that FMR support is only used in experimental versions of the
479              o2iblnd - this change does not affect standard usage at all.
480
481 Severity   : enhancement
482 Bugzilla   : 11245
483 Description: new ko2iblnd module parameter: ib_mtu
484 Details    : the default IB MTU of 2048 performs badly on 23108 Tavor
485              HCAs.  You can avoid this problem by setting the MTU to 1024
486              using this module parameter.
487
488 Severity   : enhancement
489 Bugzilla   : 11118/11620
490 Description: ptllnd small request message buffer alignment fix
491 Details    : Set the PTL_MD_LOCAL_ALIGN8 option on small message receives.
492              Round up small message size on sends in case this option
493              is not supported.  11620 was a defect in the initial
494              implementation which effectively asserted all peers had to be
495              running the correct protocol version which was fixed by always
496              NAK-ing such requests and handling any misalignments they
497              introduce.
498
499 Severity   : minor
500 Frequency  : rarely
501 Description: When kib(nal|lnd)_del_peer() is called upon a peer whose
502              ibp_tx_queue is not empty, kib(nal|lnd)_destroy_peer()'s
503              'LASSERT(list_empty(&peer->ibp_tx_queue))' will fail.
504
505 Severity   : enhancement
506 Bugzilla   : 11250
507 Description: Patchless ZC(zero copy) socklnd
508 Details    : New protocol for socklnd, socklnd can support zero copy without
509              kernel patch, it's compatible with old socklnd. Checksum is 
510              moved from tunables to modparams.
511
512 Severity   : minor
513 Frequency  : rarely
514 Description: When ksocknal_del_peer() is called upon a peer whose
515              ksnp_tx_queue is not empty, ksocknal_destroy_peer()'s
516              'LASSERT(list_empty(&peer->ksnp_tx_queue))' will fail.
517
518 Severity   : normal
519 Frequency  : when ptlrpc is under heavy use and runs out of request buffer
520 Bugzilla   : 11318
521 Description: In lnet_match_blocked_msg(), md can be used without holding a
522              ref on it.
523
524 Severity   : minor
525 Frequency  : very rarely
526 Bugzilla   : 10727
527 Description: If ksocknal_lib_setup_sock() fails, a ref on peer is lost.
528              If connd connects a route which has been closed by
529              ksocknal_shutdown(), ksocknal_create_routes() may create new
530              routes which hold references on the peer, causing shutdown
531              process to wait for peer to disappear forever.
532
533 Severity   : enhancement
534 Bugzilla   : 11234
535 Description: Dump XT3 portals traces on kptllnd timeout
536 Details    : Set the kptllnd module parameter "ptltrace_on_timeout=1" to
537              dump Cray portals debug traces to a file.  The kptllnd module
538              parameter "ptltrace_basename", default "/tmp/lnet-ptltrace",
539              is the basename of the dump file.
540
541 Severity   : major
542 Frequency  : infrequent
543 Bugzilla   : 11308
544 Description: kernel ptllnd fix bug in connection re-establishment
545 Details    : Kernel ptllnd could produce protocol errors e.g. illegal
546              matchbits and/or violate the credit flow protocol when trying
547              to re-establish a connection with a peer after an error or
548              timeout. 
549
550 Severity   : enhancement
551 Bugzilla   : 10316
552 Description: Allow /proc/sys/lnet/debug to be set symbolically
553 Details    : Allow debug and subsystem debug values to be read/set by name
554              in addition to numerically, for ease of use.
555
556 Severity   : normal
557 Frequency  : only in configurations with LNET routers
558 Bugzilla   : 10316
559 Description: routes automatically marked down and recovered
560 Details    : In configurations with LNET routers if a router fails routers
561              now actively try to recover routes that are down, unless they
562              are marked down by an administrator.
563
564 ------------------------------------------------------------------------------
565
566 2006-12-09  Cluster File Systems, Inc. <info@clusterfs.com>
567
568 Severity   : critical
569 Frequency  : very rarely, in configurations with LNET routers and TCP
570 Bugzilla   : 10889
571 Description: incorrect data written to files on OSTs
572 Details    : In certain high-load conditions incorrect data may be written
573              to files on the OST when using TCP networks.
574
575 ------------------------------------------------------------------------------
576
577 2006-07-31  Cluster File Systems, Inc. <info@clusterfs.com>
578         * version 1.4.7
579         - rework CDEBUG messages rate-limiting mechanism b=10375
580         - add per-socket tunables for socklnd if the kernel is patched b=10327
581
582 ------------------------------------------------------------------------------
583
584 2006-02-15  Cluster File Systems, Inc. <info@clusterfs.com>
585         * version 1.4.6
586         - fix use of portals/lnet pid to avoid dropping RPCs b=10074
587         - iiblnd wasn't mapping all memory, resulting in comms errors b=9776
588         - quiet LNET startup LNI message for liblustre b=10128
589         - Better console error messages if 'ip2nets' can't match an IP address
590         - Fixed overflow/use-before-set bugs in linux-time.h
591         - Fixed ptllnd bug that wasn't initialising rx descriptors completely
592         - LNET teardown failed an assertion about the route table being empty
593         - Fixed a crash in LNetEQPoll(<invalid handle>)
594         - Future protocol compatibility work (b_rls146_lnetprotovrsn)
595         - improve debug message for liblustre/Catamount nodes (b=10116)
596
597 2005-10-10  Cluster File Systems, Inc. <info@clusterfs.com>
598         * Configuration change for the XT3
599              The PTLLND is now used to run Lustre over Portals on the XT3.
600              The configure option(s) --with-cray-portals are no longer
601              used.  Rather --with-portals=<path-to-portals-includes> is
602              used to enable building on the XT3.  In addition to enable
603              XT3 specific features the option --enable-cray-xt3 must be
604              used.
605
606 2005-10-10  Cluster File Systems, Inc. <info@clusterfs.com>
607         * Portals has been removed, replaced by LNET.
608            LNET is new networking infrastructure for Lustre, it includes a
609            reorganized network configuration mode (see the user
610            documentation for full details) as well as support for routing
611            between different network fabrics.  Lustre Networking Devices
612            (LNDS) for the supported network fabrics have also been created
613            for this new infrastructure.
614
615 2005-08-08  Cluster File Systems, Inc. <info@clusterfs.com>
616        * version 1.4.4
617        * bug fixes
618
619 Severity   : major
620 Frequency  : rare (large Voltaire clusters only)
621 Bugzilla   : 6993
622 Description: the default number of reserved transmit descriptors was too low
623              for some large clusters
624 Details    : As a workaround, the number was increased.  A proper fix includes
625              a run-time tunable.
626
627 2005-06-02  Cluster File Systems, Inc. <info@clusterfs.com>
628        * version 1.4.3
629        * bug fixes
630
631 Severity   : major
632 Frequency  : occasional (large-scale events, cluster reboot, network failure)
633 Bugzilla   : 6411
634 Description: too many error messages on console obscure actual problem and
635              can slow down/panic server, or cause recovery to fail repeatedly
636 Details    : enable rate-limiting of console error messages, and some messages
637              that were console errors now only go to the kernel log
638
639 Severity   : enhancement
640 Bugzilla   : 1693
641 Description: add /proc/sys/portals/catastrophe entry which will report if
642              that node has previously LBUGged
643
644 2005-04-06  Cluster File Systems, Inc. <info@clusterfs.com>
645        * bugs
646         - update gmnal to use PTL_MTU, fix module refcounting (b=5786)
647
648 2005-04-04  Cluster File Systems, Inc. <info@clusterfs.com>
649        * bugs
650         - handle error return code in kranal_check_fma_rx() (5915,6054)
651
652 2005-02-04  Cluster File Systems, Inc. <info@clusterfs.com>
653        * miscellania
654         - update vibnal (Voltaire IB NAL)
655         - update gmnal (Myrinet NAL), gmnalid
656
657 2005-02-04  Eric Barton  <eeb@bartonsoftware.com>
658
659         * Landed portals:b_port_step as follows...
660
661           - removed CFS_DECL_SPIN* 
662             just use 'spinlock_t' and initialise with spin_lock_init()
663
664           - removed CFS_DECL_MUTEX*
665             just use 'struct semaphore' and initialise with init_mutex()
666
667           - removed CFS_DECL_RWSEM*
668             just use 'struct rw_semaphore' and initialise with init_rwsem()
669
670           - renamed cfs_sleep_chan -> cfs_waitq
671                     cfs_sleep_link -> cfs_waitlink
672
673           - fixed race in linux version of arch-independent socknal
674             (the ENOMEM/EAGAIN decision).
675
676           - Didn't fix problems in Darwin version of arch-independent socknal
677             (resetting socket callbacks, eager ack hack, ENOMEM/EAGAIN decision)
678
679           - removed libcfs types from non-socknal header files (only some types
680             in the header files had been changed; the .c files hadn't been
681             updated at all).